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本 书 是 一 本 经 典 的 计算 机 组 成 教材 ， 自 1978 年 问世 以 来 ， 已 被 多 所 世界 知名 大 学 选 为 教材 。 本 书 知识 结构 合理 ， 
知识 点 全 面 完整 ， 基 本 概念 广泛 而 新 颖 。 书 中 不 仅 介绍 了 硬件 设计 的 原理 ， 说 明了 硬件 设计 如 何 受 软件 需求 影响 ， 而 且 
以 流行 的 商用 处 理 器 作为 范例 描述 了 各 种 基本 知识 和 基本 概念 的 应 用 方法 和 应 用 过 程 ， 上 共有 很 强 的 实用 性 。 此 外 ， 本 
书 还 涵盖 了 当今 许多 先进 的 技术 和 设计 思想 。 


本 书 特色 
@ 系统 地 介绍 了 现代 计算 机 硬件 系统 的 各 个 组 成 部 分 ， 包 括 处 理 器 、 输 入 /输出 、 存 储 器 和 互 连 标准 等 。 
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Computer Organization and Embedded Systems, Sixth Edition 





本 书 适用 于 电子 工程 、 计 算 机 工程 、 计 算 机 科学 专业 有 关 计 算 机 组 成 和 嵌入 式 系统 方面 
的 初级 课程 。 本 书 的 知识 结构 是 相对 独立 的 ， 假 定 读 者 已 具备 了 计算 机 高 级 语言 程序 设计 的 基 
本 知识 。 由 于 多 数学 习 计 算 机 组 成 的 学 生 都 已 经 学 习 了 数字 逻辑 电路 这 一 入 门 课程 ， 因 此 ， 
本 书 的 主体 内 容 没 有 包含 这 一 部 分 知识 ， 但 是 我 们 为 有 需要 的 读者 提供 了 逻辑 电路 方面 的 详 
尽 附 录 。 

本 书 融 入 了 作者 在 教授 电子 与 计算 机 工程 、 计 算 机 科学 以 及 工程 科学 专业 的 本 科 生 时 所 
积累 的 丰富 经 验 。 我 们 总 是 从 实践 的 角度 进行 计算 机 组 成 原理 的 教学 ， 因 此 在 形成 本 书 内 容 时 
的 一 个 关键 考虑 是 使 用 从 商用 计算 机 中 提取 的 实例 来 详细 解释 主要 原理 。 本 书 中 主要 的 商业 实 
例 来 源 于 : Altera 的 Nios II、Freescale 的 ColdFire、ARM 以 及 Intel 的 IA-32 体系 结构 。 

读者 必须 清楚 地 认识 到 ， 数 字 系 统 的 设计 并 不 是 应 用 最 佳 设计 算法 的 简单 过 程 。 许 多 设 
计 决 策 取决 于 大 量 试探 性 的 判断 和 经 验 。 这 包括 在 一 系列 选择 方案 中 进行 成 本 / 性能、 硬件 / 
软件 的 权衡 。 我 们 的 目标 就 是 把 这 些 思 想 传达 给 读者 。 

本 书 可 以 作为 工程 学 或 计算 机 科学 专业 一 个 学 期 的 课程 用 书 ， 也 适用 于 软件 和 硬件 方向 
的 学 生 。 尽 管 本 书 侧重 于 硬件 ， 我 们 仍 阐述 了 大 量 有 关 软 件 方面 的 问题 。 

McGraw-Hill 建立 了 一 个 包含 本 书 辅助 材料 的 网 站 : http://www.mhhe.com/hamacher。 


本 书 的 内 容 

前 3 章 介 绍 了 计算 机 的 基本 结构 ， 在 机 器 指令 级 执行 的 操作 ， 以 及 程序 员 可 见 的 输入 / 输 
出 方法 。 第 4 章 讲述 了 将 汇编 语言 和 高 级 语言 编写 的 程序 翻译 成 机 器 语言 以 及 管理 其 执行 过 程 
所 需要 的 系统 软件 。 后 8 章 讨论 了 包括 内 人 式 系统 在 内 的 现代 计算 机 中 硬件 设备 的 组 织 结构 、 
互 连 和 性 能 。 

本 书 还 提供 了 5 个 详尽 的 附录 。 附 录 A 涵盖 了 数字 逻辑 电路 。 其 后 的 4 个 附录 分 别 描 
述 了 4 种 流行 的 商业 指令 集体 系 结构 Altera 的 Nios II、Freescale 的 ColdFire、ARM 以 及 
Intel 的 IA-32。 

第 1 章 对 计算 机 硬件 给 出 了 总 体 描述 ， 并 对 后 续 章节 中 将 会 深入 讨论 的 术语 进行 了 概括 
性 介绍 。 该 章 介绍 了 基本 功能 部 件 以 及 它们 相互 作用 组 成 一 个 完整 计算 机 系统 的 方法 ， 讨 论 了 
数 和 字符 的 表示 以 及 基本 的 算术 运算 ,还 介绍 了 性 能 问题 以 及 计算 机 的 发 展 简 史 。 

第 2 章 系统 地 介绍 了 机 器 指令 、 寻 址 技术 和 指令 序列 。 该 章 使 用 通用 的 汇编 语言 表示 
的 机 器 指令 级 别 的 程序 示例 来 讨论 循环 、 子 程序 和 堆栈 等 概念 。 在 介绍 这 些 概 念 时 ， 使 用 了 
RISC 风格 的 指令 集体 系 结构 ， 此 外 还 包括 了 与 CISC 风格 指令 集 的 比较 描述 。 

第 3 章 从 程序 员 的 角度 介绍 了 基本 的 输入 /输出 技术 。 该 章 说 明了 如 何 使 用 轮 询 法 进行 程 
序 控制 WO， 以 及 在 LO 传输 中 如 何 使 用 中 断 。 

第 4 章 介绍 了 系统 软件 。 该 章 说 明了 编译 器 、 汇 编程 序 、 连 接 程序 和 装载 程序 执行 的 任 
务 ， 描 述 了 跟踪 和 显示 程序 执行 结果 的 实用 程序 ， 也 描述 了 管理 用 户 程序 的 执行 以 及 包括 中 断 
处 理 在 内 的 输入 /输出 操作 的 操作 系统 程序 。 

第 5 章 探讨 了 RISC 风格 处 理 器 的 设计 。 该 章 说 明了 提取 和 执行 不 同类 型 机 器 指令 所 需 的 
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处 理 步 骤 序 列 ， 然 后 详细 阐述 了 实现 这 些 处 理 步 又 所 需 的 硬件 组 织 ， 同 时 也 考虑 了 CISC 风格 
处 理 器 的 不 同 需求 。 

第 6 章 介绍 了 流水 线 和 多 个 执行 部 件 在 高 性 能 处 理 器 设计 中 的 使 用 。 该 章 利用 第 5 章 中 
描述 的 RISC 风格 处 理 器 设计 的 流水 线 版 本 来 前 明 流水 线 ， 探 讨 了 编译 器 的 作用 以 及 流水 线 执 
行 与 指令 集 设 计 之 间 的 关系 ， 还 对 超标 量 处 理 器 进行 了 讨论 。 

第 7 章 探讨 了 输入 /输出 硬件 。 该 章 讨论 了 包括 总 线 结 构 在 内 的 互连网 络 ， 说 明了 同步 和 
异步 操作 ， 也 介绍 了 包括 USB 和 PCI Express 在 内 的 互 连 标准 。 

第 8 章 讨论 了 半导体 存储 器 ， 包 括 SDRAM、Rambus 和 闪存 (Flash memory ) 的 实现 。 
该 章 介绍 了 可 增加 存储 器 带宽 的 高 速 缓存 ( cache )， 从 性 能 建 模 等 细节 上 对 其 进行 了 讨论 ， 还 
介绍 了 虚拟 存储 器 系统 、 存 储 器 管理 和 快速 地 址 转换 技术 ， 并 将 磁盘 和 光盘 作为 存储 器 层次 结 
构 的 一 部 分 进行 了 讨论 。 

第 9 章 探讨 了 计算 机 中 算术 部 件 的 实现 。 该 章 描述 了 对 补 码 数 进行 定点 加 、 减 、 乘 、 除 
操作 的 硬件 逻辑 设计 ， 解 释 了 超前 进位 加 法 器 和 快速 乘法 器 ， 并 描述 了 Booth 乘 数 重 编码 和 进 
位 保留 加 法 技术 ， 还 介绍 了 IEEE 标准 中 浮 点 数 的 表示 与 操作 。 

今天 ， 越 来 越 多 的 处 理 器 被 用 于 嵌入 式 系统 而 不 是 通用 计算 机 中 。 第 10 章 和 第 11 章 针对 
能 人 式 系统 进行 了 讨论 。 首 先 ， 在 第 10 章 中 介绍 了 系统 集成 的 基本 内 容 、 部 件 (component ) 
互 连 以 及 实时 操作 ， 还 对 微 控 制 器 的 使 用 进行 了 讨论 。 然 后 ， 第 11 章 集中 讨论 片上 系统 
( SoC ) 的 实现 ， 其 中 单一 的 芯片 上 集成 了 满足 特定 应 用 需要 的 数据 处 理 、 存 储 器 、1/O 和 定时 
器 功能 ， 并 通过 一 个 详尽 的 例子 说 明了 如 何在 这 样 的 环境 中 使 用 FPGA 和 现代 设计 工具 。 

第 12 章 讨论 了 并 行 处 理 和 性 能 。 该 章 介绍 了 用 于 增强 单 处 理 器 功能 的 硬件 多 线程 和 向 
量 处 理 ， 描 述 了 共享 存储 器 的 多 处 理 器 以 及 高 速 缓存 一 致 性 的 问题 ， 还 介绍 了 多 处 理 器 互 连 
网 络 。 

附录 A 详细 介绍 了 数字 逻辑 电路 知识 ， 可 供 没 有 修 过 电路 设计 课程 的 读者 参考 。 

附录 B、C、D 和 E 说 明了 第 2 章 和 第 3 章 中 介绍 的 指令 集 概念 在 4 种 商用 处 理 器 Nios 
I、ColdFire 、 ARM 以 及 Intel IA-32 中 的 实现 。Nios I 和 ARM 处 理 器 说 明了 RISC 的 设计 风格 。 
ColdFire 采用 了 相对 容易 理解 的 CISC 设计 ， 而 IA-32 的 CISC 体系 结构 代表 了 最 成 功 的 商业 
设计 。 每 个 处 理 器 的 介绍 都 包括 第 2 章 和 第 3 章 中 的 汇编 语言 例子 在 相应 处 理 器 中 的 实现 。 这 
些 附录 中 给 出 的 细节 对 于 理解 本 书 的 主体 内 容 来 说 不 是 必需 的 ， 只 涵盖 其 中 一 个 附录 就 足以 认 
识 商 用 处 理 器 的 指令 集 了 。 选 择 哪 个 处 理 器 作为 例子 很 可 能 受到 实际 实验 室 中 设备 的 影响 ， 教 
师 不 妨 使 用 多 个 处 理 器 来 说 明 不 同 的 设计 方法 。 


第 6 版 的 变化 

本 书 的 第 6 版 对 内 容 和 结构 安排 作 了 重大 改动 ， 主 要 包括 : 

e 用 RISC 方法 介绍 指令 集体 系 结构 的 基本 概念 ， 接 着 对 RISC 方法 与 CISC 方法 进行 了 
比较 。 

e 处 理 器 设计 的 讨论 着 重 于 RISC 风格 体系 结构 的 实现 ， 从 而 自然 地 过 渡 到 流水 线 操作 的 
介绍 。 

e 用 两 章 介 绍 了 授信 式 系统 的 内 容 : 一 章 介 绍 了 艇 人 式 系统 的 基本 结构 和 微 控 制 器 的 使 
用 ， 另 一 章 则 探讨 了 片上 系统 的 实现 。 
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e 附录 给 出 了 4 种 商用 处 理 器 的 例子 。 每 个 附录 包含 了 给 定 处 理 器 指令 集体 系 结构 的 基 


本 信息 。 
。 在 每 一 章 和 附录 的 末尾 增加 了 一 个 新 的 小 节 “ 问 题解 析 "， 给 学 生 提 供 了 一 些 典型 问题 
的 预期 解决 方案 。 
习题 的 难度 等 级 
每 一 章 和 附录 末尾 的 习题 分 为 以 下 几 类 : 简单 (E)、 中 等 (M ) 或 偏 难 (D )， 这 些 分 类 
的 解释 如 下 : 


。 简单 一 一 直接 应 用 本 书 所 介绍 的 具体 信息 便 可 以 在 几 分 钟 内 得 到 解决 方案 。 

。 中 等 一 一 通常 不 能 直接 按照 本 书 所 介绍 例子 中 采用 的 方法 来 解决 问题 。 在 某 些 情况 下 ， 
解决 方案 可 能 是 某 个 例子 的 一 般 情况 ,但 比 简单 问题 要 花 更 长 的 时 间 。 

。 偏 难 一 一 解决 这 些 问 题 需要 一 些 额外 的 洞察 力 。 如 果 一 个 解决 方案 需要 编写 程序 ， 则 
其 底层 的 算法 或 结构 可 能 跟 本 书 给 出 的 任何 程序 示例 都 不 同 。 如 果 需 要 硬件 设计 ， 它 
所 涉及 的 基本 逻辑 电路 部 件 的 布局 和 互 连 可 能 跟 本 书 所 示 的 任何 设计 示例 都 不 同 。 如 
果 要 进行 性 能 分 析 ， 它 可 能 需要 推导 代数 表达 式 。 


课程 安排 

本 书 适合 作为 大 学 计算 机 组 成 人 门 课程 一 学 期 的 教材 。 

书 中 提供 了 多 于 一 个 学 期 课程 所 要 讲授 的 内 容 ， 第 1 章 至 第 9 章 给 出 了 关于 计算 机 组 成 
和 有 关 软 件 问题 的 核心 内 容 。 未 学 习 过 修 辑 电路 课程 的 学 生 ， 应 该 在 学 习 第 5 章 之 前 学 习 附 录 
A 的 内 容 。 

针对 瞬 人 式 系统 的 课程 应 该 包括 第 1、2、3、4、7、8、10 和 11 章 。 

感 兴趣 的 学 生 可 在 教师 的 指导 下 在 相关 的 硬件 实验 室 中 实践 附录 B 到 E 中 商用 处 理 器 例 
子 的 内 容 。 
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Computer Organization and Embedded Systems, Sixth Edition | 


计算 机 的 基本 结构 


本 章 目标 
在 本 章 中 你 将 学 习 以 下 内 容 : 
计算 机 的 不 同类 型 
计算 机 的 基本 结构 与 操作 
机 器 指令 及 其 执行 
数 与 字符 的 表示 
二 进 制 数 的 加 法 与 减法 
计算 机 系统 中 的 基本 性 能 问题 
计算 机 发 展 简 史 
本 书 讲述 的 是 计算 机 的 组 成 结构 。 书 中 描述 了 数字 计算 机 中 用 于 存储 和 处 理 信息 的 各 个 
部 件 的 功能 和 设计 ， 还 介绍 了 与 计算 机 相连 的 从 外 部 设备 接收 信息 的 输入 部 件 和 向 外 部 指定 设 
备 传送 计算 结果 的 输出 部 件 。 输入、 存储 、 处 理 和 输出 操作 由 组 成 程序 的 一 系列 指令 管理 。 
本 书 的 大 部 分 内 容 是 专门 针对 计算 机 硬件 (computer hardware ) 和 计算 机 体系 结构 
( computer architecture ) 的 。 计 算 机 硬件 由 电子 电路 、 磁 性 和 光 存 储 介质 、 显 示 器 、 电 气 机 械 
设备 以 及 通信 设施 等 构成 ， 计 算 机 体系 结构 包含 具体 的 指令 集 和 用 于 执行 这 些 指令 的 硬件 设备 
的 功能 行为 。 
本 书 还 介绍 了 计算 机 系统 中 有 关 程 序 设 计 和 软件 组 件 方 面 的 许多 知识 。 要 想 对 计算 机 系 
统 有 一 个 好 的 认识 ， 重要 的 是 对 各 个 计算 机 部 件 设计 中 的 硬件 和 软件 都 要 有 所 认识 。 


1.1 计算 机 的 类 型 

自 20 世纪 40 年 代数 字 计 算 机 发 明 以 来 ,计算 机 已 逐步 分 化 为 在 其 大 小 、 成 本 、 计 算 能 
力 和 使 用 目的 上 有 着 很 大 不 同 的 许多 类 型 。 现 代 计算 机 大 致 可 以 分 为 四 大 类 : 

@ 嵌入 式 计 算 机 (embedded computer ) 集成 在 一 个 较 大 的 设备 或 系统 中 ， 用 以 自动 监控 
与 控制 物理 过 程 或 环境 。 它 们 被 用 于 特定 的 目的 ， 而 不 是 通用 的 任务 处 理 。 其 典型 应 
用 包括 工业 和 家 庭 自动 化 、 家 电 、 通 信 产 品 和 交通 工具 。 用 户 甚 至 可 能 并 不 知道 计算 
机 在 这 类 系统 中 发 挥 了 作用 。 
个 人 计算 机 (personal computer ) 在 家 庭 、 教 育 机 构 以 及 商业 与 工程 办 公 环 境 中 广泛 
使 用 ， 但 主要 用 于 个 人 用 途 。 个 人 计算 机 支持 各 种 各 样 的 应 用 ， 如 通用 计算 、 文 档 编 
制 、 计 算 机 辅助 设计 、 视 听 娱 乐 、 人 际 交流 和 互联 网 浏览 。 如 今 有 很 多 种 对 个 人 计算 
机 进行 分 类 的 方法 。 台 式 计算 机 ( desktop computer ) 可 以 满足 一 般 的 需求 ， 并 占用 较 
少 的 工作 空间 。 工 作 站 计算 机 ( workstation computer ) 为 工程 和 科学 计算 提供 更 高 的 
计算 能 力 和 更 强大 的 图 形 显示 能 力 。 便 扒 式 计算 机 ( portable computer ) 和 笔记 本 电脑 
( notebook computer ) 提供 了 个 人 计算 机 的 基本 功能 ， 它 们 可 以 使 用 电池 操作 以 提供 一 
定 的 移动 性 。 
@ 服务 器 (server) 和 企业 系统 (enterprise system ) 是 能 被 大 量 用 户 共 享 的 大 型 计算 机 ， 

这 些 用 户 通常 会 从 某 种 形式 的 个 人 计算 机 上 通过 公有 或 私有 网 络 发 起 访问 。 这 些 计算 
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机 可 包含 大 型 的 数据 库 ， 为 政府 机 构 或 商业 组 织 提 供 信 息 处 理 服 务 。 
@ 超级 计算 机 ( super computer ) 和 网 格 计算 机 ( grid computer ) 通常 提供 最 高 的 性 能 ， 它 
们 是 最 昂贵 的 以 及 物理 上 最 大 型 的 计算 机 。 超 级 计算 机 用 于 天 气 预 报 、 工 程 设 计 与 仿 
真 以 及 科研 等 对 计算 要 求 极 高 的 领域 中 。 因 为 超级 计算 机 需要 很 高 的 成 本 ， 所 以 出 现 
了 更 经 济 的 网 格 计算 机 。 网 格 计算 机 把 大 量 的 个 人 计算 机 和 磁盘 存储 单元 整合 在 一 个 
物理 上 分 散 的 高 速 网 络 中 ， 这 称 为 网 格 ， 它 被 当成 一 个 整体 计算 资源 来 管理 。 通 过 在 
网 格 中 均匀 地 分 配 计 算 工 作 量 ， 网 格 计算 机 可 以 在 数值 计算 和 信息 检索 等 大 型 应 用 上 
获得 很 高 的 性 能 
计算 机 界 的 一 个 新 趋势 是 云 计算 ( cloud computing ): 个 人 计算 机 用 户 为 了 自己 的 计算 需 
求 去 访问 广泛 分 布 的 计算 和 存储 服务 器 资源 。 互 联网 提供 了 必要 的 通信 设施 。 云 端 软 硬 件 服务 
提供 商 把 云 作 为 一 种 工具 进行 运作 ， 基 于 按 使 用 付费 的 模式 进行 收费 。 


1.2 ”功能 部 件 


计算 机 包括 五 个 功能 相对 独立 的 主要 部 分 : 输入 设备 、 存 储 器 、 算 术 逻 辑 部 件 、 输 出 设备 
和 控制 器 ， 如 图 1-1 所 示 。 输 入 设备 接收 来 自 使 用 键盘 等 设备 的 操作 员 或 者 通过 数字 通信 线路 
连接 的 其 他 计算 机 上 的 编码 信息 。 所 接收 的 信息 存储 在 计算 机 的 存储 器 中 供 以 后 使 用 ， 或 者 立 
即 被 算术 逻辑 部 件 处理 。 这 个 处 理 步 又 是 由 同样 存储 在 存储 器 中 的 一 个 程序 指定 的 。 最 后 ， 处 
理 的 结果 通过 输出 设备 送 回 到 外 部 设备 中 。 所 有 这 些 动 作 都 是 由 控制 器 控制 和 协调 的 。 互 连 网 
络 提供 了 这 些 功能 部 件 间 交 换 信息 和 协调 动作 的 方法 ， 后 面 的 章节 将 会 详细 讨论 单个 部 件 以 及 
它们 之 间 的 互 连 。 前 面 提 到 的 算术 逻辑 电路 与 主 控制 电路 结合 构成 了 处 理 器 (processor )， 输 
入 设备 和 输出 设备 通常 整体 称 为 输入 /输出 (input-output, IO ) 设备 。 


输出 设备 控制 器 


输入 /输出 设备 处 理 器 
图 1-1 计算 机 的 基本 功能 部 件 


现在 仔细 观察 一 下 计算 机 所 处 理 的 信息 。 把 信息 划分 成 指令 和 数据 以 便于 讨论 。 指 令 
(instruction )， 或 称 为 机 器 指令 ( machine instruction )， 是 具体 的 命令 ， 它 们 : 

e 控制 计算 机 与 IO 设备 之 间 以 及 计算 机 内 部 的 信息 传送 。 

e 指定 要 执行 的 算术 和 逻辑 运算 。 

程序 (program ) 是 执行 任务 的 指令 序列 。 程 序 存 储 在 存储 器 中 。 处 理 器 从 存储 器 中 一 条 
接 一 条 地 取出 程序 指令 ， 然 后 完成 所 需要 的 操作 。 除 了 可 能 有 来 自 于 操作 员 或 与 计算 机 连接 的 
IO 设备 上 的 外 部 中 断 以 外 ， 计 算 机 由 所 存储 的 程序 控制 。 数 据 ( data ) 是 指 作为 指令 操作 数 
的 数字 和 字符 。 数 据 也 存储 在 存储 器 中 。 

计算 机 处 理 的 指令 和 数据 必须 按照 适当 的 格式 进行 编码 。 当 今 的 大 多 数 硬件 使 用 的 是 只 
有 两 个 稳定 状态 的 数字 电路 。 指 令 、 数 字 或 字符 都 被 编码 成 叫做 位 (bit ) 的 二 进 制 数字 串 ， 每 
个 位 只 能 从 表示 两 个 稳定 状态 的 0 和 1 中 取 一 个 。 数 字 通 常用 按 位 二 进 制 记 数 法 表示 ， 这 将 在 
1.4 节 中 讨论 。 字母 数字 字符 也 可 以 用 二 进 制 码 表示 ， 这 将 在 1.5 节 中 讨论 。 
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1.2.1 输入 设备 

计算 机 通过 输入 设备 接收 编码 后 的 信息 。 最 常见 的 输入 设备 就 是 键盘 。 当 一 个 键 被 敲 击 
时 ， 相 应 的 字母 或 数字 就 会 自动 转换 成 相应 的 二 进 制 码 并 传送 到 处 理 器 中 。 

还 有 许多 其 他 类 型 的 用 于 人 机 交互 的 输入 设备 ， 包 括 触摸 板 、 鼠 标 、 操 纵 杆 和 轨迹 球 。 
这 些 设备 经 常 作为 图 形 输入 装置 与 显示 器 一 起 使 用 。 麦 克 风 可 以 用 来 捕获 音频 输入 ， 然 后 对 其 
取样 并 转换 为 数字 编码 进行 存储 和 人 处理。 同样 ， 摄 像 涉 可 以 用 来 捕获 视频 输入 。 

数字 通信 设施 ， 例 如 互联 网 ， 也 可 以 从 其 他 计算 机 或 数据 库 服务 器 向 一 台 计 算 机 提供 输入 。 


1.2.2 ”存储 器 

存储 器 的 功能 是 存储 程序 和 数据 。 它 分 为 主 存储 器 和 辅助 存储 器 两 种 。 

1， 主 存储 器 

主 存储 器 (primary memory )， 也 称 为 主 存 ( main memory )， 是 以 电子 速度 运行 的 高 速 存储 
器 。 程 序 在 执行 时 必须 要 存储 在 主 存 中 。 主 存 由 大 量 的 半导体 存储 单元 ( cell ) 组 成 ， 每 一 个 存 
储 单元 能 够 存储 一 位 二 进 制 信息 。 这 些 单元 很 少 被 单独 地 读 取 或 写 入 ， 而 是 按 固定 大 小 的 组 进 
行 处 理 ， 这 个 组 称 为 字 (word )。 主 存 这 样 组 织 以 便于 在 一 个 基本 操作 中 可 以 存储 或 检索 一 个 
字 。 每 个 字 所 包含 的 位 数 称 为 计算 机 的 字 长 (word length )， 典 型 的 字 长 有 16、32 或 64 位 。 

为 了 能 方便 地 访问 主 存 中 的 任何 一 个 字 ， 每 个 字 单 元 都 与 一 个 不 同 的 地 址 (address ) 相 
关联 。 地 址 是 从 0 开始 的 ， 是 用 来 识别 逐个 单元 的 连续 数字 。 指 明 一 个 特定 字 的 地 址 ， 然 后 向 
主 存 发 出 一 条 开始 进行 存储 或 检索 过 程 的 控制 命令 ， 就 能 够 对 该 字 进 行 访问 了 。 

在 处 理 器 的 控制 下 ， 指 令 和 数据 既 可 以 写 入 主 存 也 可 以 从 主 存 中 读 出 。 在 主 存 中 能 够 尽 
快 地 访问 到 任意 位 置 的 字 是 非常 重要 的 。 其 中 的 任何 单元 在 指明 了 地 址 后 都 能 在 一 个 很 短 的 固 
定时 间 内 访问 到 的 存储 器 ， 叫 做 随机 访问 存储 器 ( random-access memory, RAM )， 访 问 一 个 字 
所 需要 的 时 间 叫 做 存储 器 访问 时 间 (memory access time )。 这 个 时 间 与 所 访问 的 字 的 位 置 无 关 。 
当今 RAM 设备 的 访问 时 间 通 常 在 几 纳 秒 (ns ) 至 100 纳 秒 之 间 。 

2， 高 速 缓存 

作为 主 存储 器 的 辅助 手段 ， 一 个 更 小 、 更 快 的 被 称 为 高 速 缓存 ( cache ) 的 RAM 设备 可 
用 于 存储 目前 正在 执行 的 程序 段 以 及 所 有 相关 的 数据 。 高 速 缓存 与 处 理 器 紧密 耦合 ， 它 们 通常 
被 装 在 同一 个 集成 电路 芯片 上 。 高 速 缓存 的 目的 是 为 了 提高 指令 的 执行 速率 。 

在 程序 开始 执行 的 时 候 ， 高 速 缓存 是 空 的 。 所 有 程序 指令 和 任何 所 需 的 数据 都 存储 在 主 
存 中 。 随 着 执行 过 程 的 推进 ， 指 令 被 读 取 到 处 理 器 芯片 中 ， 并 且 在 高 速 缓 存 中 存放 每 一 条 指令 
的 副本 。 当 指令 的 执行 需要 主 存 中 的 数据 时 ， 数 据 被 取出 并 同时 被 拷贝 到 高 速 缓存 中 。 

现在 ,假设 许多 指令 在 一 段 很 短 的 时 间 内 重复 执行 ， 比 如 程序 中 的 循环 语句 。 如 果 这 些 指 
令 可 从 高 速 缓存 中 获得 ， 那 么 它们 可 以 在 重复 使 用 时 被 很 快 地 取出 来 。 类 似 地 ， 如 果 相 同 的 数 
据 单元 被 反复 访问 ， 而 这 些 内 容 的 副本 可 从 高 速 缓存 中 获得 ， 那 么 它们 就 可 以 被 很 快 地 取出 来 。 

3 辅助 存储 器 

虽然 主 存储 器 是 必需 的 ， 但 它 的 价格 也 是 昂贵 的 ， 而 且 断 电 后 无 法 保存 信息 。 因 此 在 需 
要 存储 大 量 数 据 和 程序 ， 尤 其 是 那些 不 经 常 访 问 的 信息 时 ， 就 会 使 用 比较 便宜 的 永久 性 辅助 
存储 器 ( secondary storage )。 辅 助 存 储 器 的 访问 时 间 比 主 存储 器 的 长 。 辅 助 存储 设备 有 很 多 
种 ， 包 括 磁盘 ( magnetic disk )、 光 盘 (optical disk，DVD 和 CD ) 和 闪存 设备 (flash memory 
device ) 等 。 
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1.2.3 ”运算 器 

大 多 数 计算 机 的 操作 是 由 处 理 器 的 算术 远 辑 部 件 ( arithmetic and logic unit，ALU ) 或 运算 
器 执行 的 。 任 意 的 算术 或 逻辑 运算 ， 比 如 加 、 减 、 乘 、 除 或 比较 大 小 ， 都 是 通过 将 所 需 的 操作 
数 送 至 由 ALU 执行 运算 的 处 理 器 中 开始 的 。 例 如 ， 如 果 将 主 存 中 放置 的 两 个 数 求 和 ， 那 么 它 
们 被 送 和 人 处理 器 中 ， 然 后 由 ALU 执行 加 法 操作 。 所 求 得 的 和 可 能 存储 在 主 存 中 或 保留 在 处 理 
器 中 以 便 直 接 使 用 。 

当 操 作 数 被 送 入 处 理 器 时 ， 它 们 被 存储 在 叫做 寄存 器 register ) 的 高 速 存储 单元 中 。 每 个 
寄存 器 可 以 存储 一 个 字 的 数据 。 寄 存 器 的 访问 时 间 比 处 理 器 芯片 上 的 高 速 缓存 的 访问 时 间 更 短 。 


1.2.4 输出 设备 

输出 设备 与 输入 设备 相对 应 。 它 的 功能 是 向 外 界 输出 处 理 结果 。 这 类 设备 中 一 个 常见 的 
例子 是 打印 机 (printer )。 大 多 数 打印 机 使 用 激光 打印 机 中 的 复印 技术 或 是 喷 墨 流 完成 打印 过 
程 。 这 样 的 打印 机 每 分 钟 至 少 可 以 打印 20 页 。 但 是 ， 打 印 机 是 机 械 设备 ， 这 样 的 速度 和 处 理 
器 的 电子 速度 相 比 仍然 是 很 慢 的 。 

一 些 设备 ， 比 如 图 形 显示 器 ， 既 有 显示 文字 与 图 形 这 样 的 输出 功能 ， 又 有 通过 触摸 技术 
实现 的 输入 功能 。 这 也 是 很 多 情况 下 对 这 种 具有 双重 作用 的 设备 使 用 单一 名 称 输入 /输出 设备 
的 原因 。 


1.2.5 ”控制 器 

存储 器 、 运 算 器 和 输入 /输出 设备 对 信息 进行 存储 和 处 理 ， 然 后 执行 输入 和 输出 操作 。 这 
些 设 备 的 操作 必须 按照 一 定 的 方式 互相 协调 ， 这 就 是 控制 器 的 职责 。 控 制 器 是 高 效 的 中 枢 系 
统 ， 它 将 控制 信号 传送 到 其 他 设备 并 检测 它们 的 状态 。 

由 输入 和 输出 操作 构成 的 IO 传输 是 由 程序 指令 控制 的 ， 程 序 指令 识别 相关 的 设备 和 
需要 传输 的 信息 。 控 制 电路 负责 产生 控制 传输 和 决定 何 时 发 生 规 定 动作 的 时 序 信号 (timing 
signal )。 处 理 器 和 存储 器 之 间 的 数据 传送 也 是 由 控制 器 通过 时 序 信和 号 控制 的 。 于 是 有 理由 将 控 
制 器 看 成 一 个 意义 明确 而 且 物 理 上 完全 独立 的 设备 ， 它 和 计算 机 的 其 他 部 分 相互 作用 。 但 在 实 
际 中 情况 却 恰恰 相反 。 很 多 控制 电路 分 布 于 整个 计算 机 中 。 大 量 的 控制 线 ( 缆 线 ) 传递 着 所 有 
部 件 中 事件 的 时 序 和 同步 信号 。 

一 台 计 算 机 的 操作 可 以 归纳 如 下 : 

。 计算 机 通过 输入 设备 以 程序 和 数据 的 形式 接收 信息 ， 然 后 将 其 存储 在 存储 器 中 。 

。 在 程序 的 控制 下 ， 存 储 在 存储 器 中 的 信息 被 取出 ， 然 后 送 入 运算 器 中 进行 处 理 。 

。 经 过 处 理 的 信息 由 输出 设备 送出 计算 机 。 

e 计算 机 内 的 所 有 活动 都 由 控制 器 控制 。 


1.3 基本 操作 概念 

在 1.2 节 中 ， 我们 介绍 了 计算 机 的 活动 是 由 指令 控制 的 。 为 了 执行 一 个 给 定 的 任务 ， 要 在 
存储 器 中 存储 一 个 包含 一 连 串 指令 的 相应 程序 。 完 成 特定 操作 的 指令 从 存储 器 中 取出 ， 然 后 送 
入 处 理 器 中 ， 用 作 指 令 操作 数 的 数据 也 存储 在 存储 器 中 。 

一 条 典型 的 指令 如 下 : 
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Load R2,LOC 
这 条 指令 将 读 取 地 址 标签 LOC 所 指向 的 存储 单元 的 内 容 ， 然 后 将 其 装 入 处 理 器 寄存 器 R2 中 。 
LOC 单元 中 原来 的 内 容 被 保存 了 下 来 ， 而 寄存 器 R2 中 的 原始 内 容 被 覆盖 了 。 这 条 指令 需要 执 
行 若干 步 。 首 先 ， 指 令 从 存储 器 中 取出 并 被 送 入 处 理 器 中 。 然 后， 由 控制 器 确定 将 要 执行 的 操 
作 ， 从 存储 器 中 取出 LOC 单元 的 操作 数 并 送 入 处 理 器 。 最 后 ， 将 操作 数 存 储 到 寄存 器 R2 中 。 

在 操作 数 已 经 从 存储 器 装 人 处 理 器 寄存 器 后 ， 就 可 以 对 它们 进行 算术 或 逻辑 运算 了 。 例 

如 ， 指 令 

Add R4,R2,R3 
把 寄存 器 R2 与 R3 的 内 容 相 加 ， 然 后 将 它们 的 和 放 入 寄存 器 R4 中 。R2 与 R3 中 的 操作 数 并 未 
发 生 改 变 ， 但 R4 中 先前 的 值 被 计算 结果 覆盖 了 。 

完成 所 需 的 操作 后 ， 计 算 结果 还 在 处 理 器 寄存 器 中 。 可 以 通过 使 用 如 下 指令 将 计算 结果 

传送 到 存储 器 中 

Store R4,LOC 
这 条 指令 将 寄存 器 R4 中 的 操作 数 复制 到 存储 单元 LOC 中。 单元 LOC 中 的 原始 内 容 被 覆盖 
但 是 R4 的 原始 内 容 被 保存 了 下 来 。 

对 Load 和 Store 指令 而 言 ， 存 储 器 和 处 理 器 之 间 的 传送 从 发 送 所 需要 的 存储 单元 地 址 给 
存储 器 并 发 出 适当 的 控制 信号 开始 ， 然 后 将 数据 送信 或 送出 存储 器 。 

图 1-2 显示 了 存储 器 和 处 理 器 是 如 何 连接 在 一 起 的 ， 也 显示 了 一 些 还 没有 讨论 过 的 处 理 器 
部 件 。 这 些 部 件 间 的 互 连 并 没有 明确 表示 出 来 ， 因 为 到 此 为 止 我 们 只 讨论 了 它们 的 功能 特性 。 
第 5 章 将 详细 描述 作为 处 理 紫 结构 一 部 分 的 互 连 的 细节 。 

除 ALU 和 控制 电路 外 ， 处 理 器 中 还 包含 许多 用 于 不 同 目 的 的 寄存 器 。 指 令 寄 存 器 
( instruction register, IR ) 保存 当前 正在 执行 的 指令 。 它 的 输出 结果 可 由 控制 电路 使 用 ， 以 产生 
控制 指令 执行 过 程 中 不 同 处 理 部 件 的 时 序 信号 。 程 序 计数 器 ( program counter, PC ) 是 男 一 个 
专用 的 寄存 器 。 它 包含 下 一 条 即将 被 读 取 和 执行 的 指令 的 存储 器 地 址 。 在 一 条 指令 的 执行 过 
程 中 ，PC 中 的 内 容 相 应 地 更 新 为 下 一 条 将 被 执行 指令 的 地 址 。 习 惯 上 说 PC 指向 (point ) 下 
一 条 将 从 存储 器 中 取出 的 指令 。 除 了 限 和 PC， 图 1-2 还 给 出 了 通用 寄存 器 ( general-purpose 
register ) Ro 到 Re， 通 常 也 被 称 作 处 理 器 寄存 器 。 它 们 的 功能 有 很 多 ,包括 保存 从 存储 器 中 载 
入 的 待 处 理 的 操作 数 。 通 用 寄存 器 的 作用 将 在 第 2 章 中 详细 解释 。 


主 存储 器 | 
| 


i 
| 


= 村 后 

| 处 理 器 -存储 器 接口 | | 
R 
R 





ALU 


个 通用 寄存 器 
图 1-2 处 理 器 和 主 存储 器 之 间 的 连接 
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处 理 器 -存储 器 接口 是 管理 主 存储 器 和 处 理 器 之 间 数 据 传输 的 电路 。 如 果 需 要 从 存储 器 中 
读 取 一 个 字 ， 该 接口 会 向 存储 器 发 送 该 字 的 地 址 ， 同 时 送出 一 个 读 控制 信号 。 接 口 等 待 要 取 回 
的 字 ， 然 后 将 它 传输 到 适当 的 处 理 器 寄存 器 中 。 如 果 一 个 字 需 要 被 写 人 到 存储 器 中 ， 接 口 会 向 
存储 器 传输 该 字 的 存储 地 址 和 内 容 ， 同 时 送出 一 个 写 控制 信和 号。 

现在 来 看 一 下 典型 的 操作 步 又。 为 了 便于 执行 ， 程 序 必 须 存 储 在 主 存储 器 中 ， 而 且 通 常 
是 通过 输入 设备 从 辅助 存储 器 传输 到 主 存储 器 的 。 当 PC 指向 程序 的 第 一 条 指令 时 ， 程 序 开始 
执行 。PC 中 的 内 容 连 同一 个 读 控 制 信号 一 起 传送 到 存储 器 中 。 当 被 寻 址 的 字 ( 在 这 里 是 程序 
的 第 一 条 指令 ) 从 存储 器 中 读 出 时 ， 它 被 装 人 寄存 器 IR 中 。 此 时 ， 指 令 便 可 以 进行 解释 并 执 
行 了 。 

Load、Store 和 Add 等 指令 执行 数据 传输 与 算术 操作 。 如 果 指 令 需 要 一 个 保存 在 存储 器 中 
的 操作 数 ， 就 需要 通过 将 它 的 地 址 发 送 给 存储 器 并 启动 一 个 读 操 作 来 获取 。 当 这 个 操作 数 已 经 
从 存储 器 中 读 出 时 ， 它 将 被 传送 到 处 理 器 寄存 器 中 。 当 操作 数 按照 这 种 方式 取出 后 ，ALU 就 
可 以 对 处 理 器 寄存 器 中 的 值 执行 所 需要 的 算术 运算 了 ， 比 如 加 法 。 运 算 结 果 会 送 到 一 个 处 理 器 
寄存 器 中 。 如 果 这 个 结果 将 通过 Store 指令 被 写 人 存储 器 中 ， 它 会 被 从 处 理 器 寄存 器 传输 到 存 
储 器 中 ， 存 储 该 结果 的 单元 地 址 也 将 送 往 存 储 器 ， 然 后 开始 一 个 写 操作 。 

在 每 条 指令 执行 过 程 中 的 某 个 点 上 ，PC 中 的 内 容 递增 ， 以 便 使 PC 指向 下 一 条 要 执行 的 
指令 。 这 样 ， 一 旦 当前 的 指令 执行 完毕 ， 处 理 器 就 可 以 读 取 新 的 指令 了 。 

除了 在 存储 器 和 处 理 器 之 间 传 送 数据 外 ， 计 算 机 还 从 输入 设备 接收 数据 以 及 向 输出 设备 
输出 数据 ， 为 此 提供 了 一 些 处 理 IO 传送 的 机 器 指令 。 

当 一 些 设 备 需 要 紧急 服务 时 ， 程 序 的 正常 执行 可 能 会 被 中 断 。 例 如 ， 在 一 个 计算 机 控制 
的 工业 流程 中 ， 监 视 器 可 能 观察 到 了 一 个 危险 的 情况 。 为 了 立即 做 出 响应 ， 必 须 暂 停 当 前 程 
序 的 执行 。 为 此 ， 设 备 发 出 一 个 中 断 (interrupt ) 信号 ， 向 处 理 器 提出 服务 请 求 。 处 理 器 通过 
执行 中 断 服务 程序 (interrupt-service routine ) 来 提供 所 请 求 的 服务 。 因 为 这 样 的 转变 可 能 会 改 
变 处 理 器 的 内 部 状态 ， 所 以 必须 在 处 理 中 断 请 求 之 前 将 处 理 器 的 状态 保存 在 存储 器 中 。 通 常 ， 
要 保存 的 信息 包括 PC 中 的 内 容 、 通 用 寄存 器 的 内 容 以 及 一 些 控制 信息 。 当 中 断 服 务 程序 完成 
时 ， 处 理 器 的 状态 就 从 存储 器 中 恢复 ， 从 而 使 得 被 中 断 的 程序 可 以 继续 执行 。 

这 一 节 对 计算 机 的 操作 进行 了 简略 介绍 ,在 后 面 的 章节 中 我 们 还 将 详细 讨论 这 些 概念 。 
第 2、3、4 章 将 首先 从 程序 员 的 角度 来 详细 描述 这 些 概 念 ， 而 后 面 的 章节 将 从 硬件 设计 师 的 角 
度 来 详细 描述 这 些 概念 。 


1.4 数 的 表示 及 算术 运算 


在 计算 机 系统 中 表示 数 的 最 基本 方法 是 使 用 一 串 位 ， 即 一 个 二 进 制 数 。 我 们 首先 描述 整 
数 的 二 进 制 表示 及 算术 运算 ， 然 后 将 简单 介绍 浮 点 数 的 表示 。 


1.4.1 整数 
考虑 一 个 n 位 的 向 量 
B= bbibo 
对 于 0 三 i 三 nn 一 1，b;= 0 或 1。 这 个 向 量 在 0 到 2”-1 的 范围 内 可 以 用 一 个 无 符号 整数 V(B) 
表示 ， 这 里 
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V(B)=bs x 2 + + bi x 2'+bo x 2° 
我 们 需要 表示 正 数 和 人 负数， 有 三 种 编码 系统 可 以 用 来 表示 这 些 数 : 

e 原 码 

e 反 码 

e 补 码 

在 这 三 种 编码 体系 中 ， 最 左边 一 位 为 “0” 时 表示 正 数 ， 为 “1” 时 表示 负数 。 图 1-3 用 4 
位 数 举例 说 明了 在 这 三 种 体系 中 数字 的 表示 方法 。 在 所 有 的 编码 体系 中 正 数 的 表示 法 相同 ， 而 
负数 有 着 不 同 的 表示 方法 。 在 原 码 (sign-and-magnitude ) 系统 中 ， 负 数值 是 将 相应 正 数值 的 向 
量 8 中 的 最 高 有 效 位 ( 图 1-3 中 的 b;) 由 0 变 为 1 来 表示 的 。 例 如 : +5 表示 为 0101，-5 表示 
为 1101。 

在 反 码 (1's-complement ) 表示 中 ， 负 数值 是 通过 将 相应 正 数 中 的 每 一 位 求 反而 获得 的 。 
因此 ，-3 的 表示 就 是 通过 对 向 量 0011 的 各 位 求 反 得 到 了 1100。 运 用 同样 的 按 位 求 反 操 作 也 可 
以 把 一 个 负数 转换 成 相应 的 正 数 。 这 种 转换 方法 就 称 作 给 一 个 特定 的 数 取 反 。 对 于 位 数 ， 为 
. 其 生成 反 码 的 操作 相当 于 从 2”!' 中 减 去 这 个 数 ， 在 图 1-3 中 的 4 位 数 情况 下 也 就 是 从 2 一 1=15 
或 者 二 进 制 的 1111 中 减 去 该 数 。 

最 后 ， 在 补 码 ( 2’s-complement ) 系统 中 ， 一 个 n 位 数 的 补 码 是 从 2" 中 减 去 这 个 数 而 得 到 
的 。 因 此 ， 一 个 数 的 补 码 可 以 用 这 个 数 的 反 码 加 1 而 获得 。 


所 表示 的 值 
原 码 反 码 补 码 
+7 十 7 十 了 






2302012o0 






已 口 虽 吕 
SOGOOGOCGCOOm 


一 一 司马 一 一 串口 口 己 一 一 喇 吕 一 一 
一 忻 一 口 一 呈 一 局 虽 一 局 一 马 一 口 一 


图 1-3 ”二进制 有 符号 整数 的 表示 


值得 注意 的 是 ,在 原 码 和 反 码 系统 中 ,“+0” 和 “-0” 都 有 着 不 同 的 表示 ， 而 在 补 码 系统 
中 “0” 只 有 一 种 表示 。 如 图 1-3 所 示 ， 对 4 位 数 来 说 ， 在 补 码 系统 中 能 表示 数值 -8， 而 在 其 
他 系统 中 却 不 能 。 原 码 系统 看 起 来 是 最 自然 的 ， 因 为 在 笔算 中 我 们 就 是 用 原 码 系统 来 处 理 十 进 
制 数 的 。 反 码 系统 很 容易 与 这 个 系统 关联 起 来 ， 而 补 码 系统 可 能 显得 有 点 不 自然 。 但 是 ， 我 们 
将 会 说 明 补 码 系统 为 实现 加 法 和 减法 运算 提供 了 最 有 效 的 方法 ， 它 是 现代 计算 机 中 最 常用 的 方 
法 之 一 。 

1. 无 符号 整数 的 加 法 

图 1-4 说 明了 1 位 数 的 加 法 。1 和 1 相 加 的 和 是 一 个 2 位 的 向 量 10， 表示 数 值 2。 我 们 说 


00] 
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这 个 和 (sum ) 是 0， 进 位 输出 (carry-out ) 是 1。 为 了 完成 多 位 数 相 加 ， 我 们 使 用 一 种 类 似 于 
十 进 制 数 笔算 中 使 用 的 方法 。 从 这 个 位 向 量 的 最 
低位 (右边 ) 开始 进行 两 位 相 加 ， 并 将 进位 传递 
到 它 的 高 位 (左边 ) 上 去 。 某 位 上 两 个 数 相 加 所 
得 的 进位 输出 作为 左边 下 一 位 的 进位 输入 ( carry- 
in )。 进 位 输入 必须 与 那个 位 置 的 两 位 相 加 ， 产 生 
和 以 及 进位 输出 。 例 如 ， 如 果 某 位 的 两 个 数 都 是 图 1-4 1 位 数 的 加 法 
1， 并 且 进 位 输入 也 是 1， 则 和 为 1， 进 位 输出 也 为 1， 即 表示 数值 3。 

2. 有 符号 整数 的 加 法 和 减法 

我 们 介绍 了 表示 正 数 和 负数 ( 或 简称 为 有 符号 数 (signed number )) 的 三 种 系统 。 这 些 系 
统 的 不 同 之 处 仅 在 于 对 负数 的 表示 方式 。 从 是 否 容 易 执行 算术 运算 的 观点 来 看 它们 的 优势 可 以 
归纳 如 下 。 原 码 系 统 在 表示 上 是 最 简单 的 ， 但 是 它 对 于 执行 加 法 和 减法 的 运算 是 最 不 便 的 。 反 
码 表示 法 稍微 好 一 些 ， 补 码 系 统 对 于 执行 加 法 和 减法 运算 是 最 有 效 的 。 

为 了 理解 补 码 的 算术 运算 ， 考虑 以 N 为 模 的 加 法 ( 简写 成 mod N )。 描 述 无 符号 整数 mod 
N 加 法 的 有 效 图 示 方 式 是 使 用 一 个 圆 ， 沿 着 它 的 圆周 标记 上 值 0 到 N-1， 如 图 1-5a 所 示 。 考 
虑 当 N = 16 的 情况 ， 如 图 1-5b 所 示 。 十 进 制 数 0 到 15 可 以 用 圆 外 侧 的 4 位 二 进 制 数 0000 到 
1111 表示 。 就 十 进 制 数 而 言 ，(7+5) mod 16 运算 得 到 的 值 是 12。 我 们 使 用 图 形 执行 这 个 运算 ， 
在 圆 外 侧 找到 7(0111) 的 位 置 ， 然 后 按 顺 时 针 方 向 移动 5 个 单位 就 到 达 了 答案 12(1100) 处 。 类 
似 地 ，(9 + 14) mod 16 =7， 即 在 圆 上 找到 9%(1001)， 然 后 按 顺 时 针 方 向 移动 14 个 单位 越过 0 的 
位 置 就 到 达 答 案 7(0111) 处 。 对 于 任何 无 符号 数 a 和 “来 说 ， 这 种 图 形 技术 对 计算 (a+b ) mod 
16 都 是 有 效 的 ， 即 为 了 完成 加 法 ， 定 位 a， 然后 按 顺 时 针 方 向 移动 b 个 单位 就 可 以 得 到 (a + 4b) 
mod 16 的 结果 。 

现在 考虑 对 于 模 数 为 16 的 圆 的 另 一 种 不 同 解释 。 我 们 按照 圆 内 侧 所 示 的 补 码 表示 将 圆 外 
侧 的 二 进 制 向 量 重新 解释 成 从 -8 到 +7 的 有 符号 数 。 

将 mod 16 的 加 法 技术 应 用 在 将 +7 加 到 -3 的 例子 上 。 这 两 个 数 的 补 码 表 示 分 别 是 0111 
和 1101。 为 了 完成 两 数 相 加 ， 在 图 1-5b 的 圆周 上 找到 0111 ， 然 后 按 顺 时 针 方向 移动 1101 (13) 
步 到 达 了 0100 处 ， 得 到 了 +4 的 正确 答案 。 值 得 注意 的 是 ，-3 的 补 码 表示 被 解释 成 一 个 无 符 
号 数 以 表示 移动 的 步 数 。 

如 果 采 用 从 右 到 左 按 位 加 的 方法 完成 这 个 加 法 ， 我 们 得 到 : 





进位 输出 


bay Ey 
bd bh 





进位 

如 果 在 这 个 加 法 中 忽略 第 四 位 上 的 进位 ， 就 得 到 了 一 个 正确 的 答案 。 实 际 上 就 是 这 样 做 
的 。 忽 略 这 个 进位 是 对 N 取 模 运算 的 自然 结果 。 当 我 们 在 图 1-5b 中 绕 着 圆 移动 时 , 1111 值 的 
下 一 个 值 通常 应 该 是 10000， 而 我 们 回 到 了 0000 值 。 

使 用 补 码 表示 系统 的 位 有 符号 数 的 加 法 和 减法 规则 可 以 描述 如 下 : 

e 两 个 数 相 加 (add ) 时 ， 它 们 的 n 个 表示 位 相 加 ， 和 忽略 最 高 有 效 位 (MSB ) 上 的 进位 
位 。 如 果实 际 结果 是 在 -2"! 到 +2”'-1 的 范围 之 内 ， 那 么 它们 的 和 将 是 用 补 码 表 示 的 
代数 运算 的 正确 值 。 

e XX 和 了 两 个 数 相 减 ( subtract )， 也 就 是 执行 X- 了 时 ， 求 出 了 的 补 码 形式 ， 然 后 使 用 加 
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法 规则 将 它 加 到 中 。 同 样 ， 如 果实 际 结果 是 在 -2 到 +2”-1 的 范围 内 ， 那 么 这 个 
结果 将 是 用 补 码 表示 的 代数 运算 的 正确 值 。 





a ) 整数 模 N 的 圆 的 表示 b ) 二 进 制 补 码 数 的 模 为 16 的 系统 
图 1-5 模 数 系统 和 补 码 系统 


在 图 1-6 中 给 出 了 一 些 补 码 系统 中 加 法 和 减法 的 例子 。 在 所 有 这 些 4 位 数 的 例子 中 ， 结 
果 都 在 -8 到 +7 的 表示 范围 。 当 结果 没有 在 表示 范围 之 内 时 ， 便 发 生 了 算术 溢出 ( arithmetic 
overflow )。 这 种 情况 将 在 后 面 的 小 节 中 讨论 。 图 1-6 中 a 到 d 四 个 加 法 运算 符合 加 法 规则 ，e 
到 j 六 个 减法 运算 符合 减法 规则 。 减 法 运算 需要 形成 减 数 ( 算式 中 下 面 的 值 ) 的 补 码 形式 ， 不 
论 减 数 为 正 数 还 是 负数 ， 这 个 运算 都 是 以 完全 相同 的 方式 完成 的 。 要 得 到 一 个 数 的 补 码 形式 ， 
需要 对 该 数 按 位 取 反 ， 然 后 加 1。 

利用 补 码 表示 法 简化 了 有 符号 数 的 加 法 和 减法 运算 ， 这 就 是 现代 计算 机 采用 补 码 表示 法 
的 理由 。 看 起 来 似乎 反 码 表示 法 与 补 码 表示 法 一 样 有 效 ， 但 是 尽管 数 的 求 反 很 容易 ， 可 是 加 法 
运算 后 得 到 的 结果 却 不 能 保证 总 是 正确 的 。 进 位 c, 不 能 被 忽略 。 如 果 c, = 0， 得 到 的 结果 是 正 
确 的 ， 如 果 cs = 1， 必 须 对 这 个 结果 加 上 1， 以 保证 它 的 正确 性 。 这 个 必需 的 修正 操作 意味 着 
加 法 和 减法 运算 在 反 码 系统 中 不 能 像 在 补 码 系统 中 那样 方便 地 实现 。 

3. 符号 扩展 

我 们 经 常 需要 用 更 多 的 位 数 来 表示 一 个 用 一 定位 数 给 出 的 值 。 对 于 一 个 正 数 ， 用 左边 加 0 
的 方法 实现 。 对 于 一 个 用 补 码 表示 法 表示 的 负数 ， 最 左边 的 位 ( 表示 数 的 符号 ) 等 于 1， 具 有 
同样 值 的 较 长 位 数 的 数 可 以 通过 在 左边 根据 需要 多 次 重复 符号 位 来 实现 。 为 了 理解 为 什么 这 样 
做 是 正确 的 ， 考 查 图 1-5b 中 的 模 为 16 的 圆 。 将 它 与 比较 大 的 圆 ， 即 模 为 32 或 模 为 64 的 情况 
做 比较 ， 值 -1、-2 等 的 表示 完全 相同 ， 只 是 用 若干 个 1 加 到 了 左边 。 概 要 地 说 ， 在 补 码 形 式 
中 为 了 用 更 多 的 位 数 来 表示 一 个 有 符号 数 ， 可 以 按照 需要 在 左边 多 次 重复 它 的 符号 位 。 这 种 操 
作 称 为 符号 扩展 ( sign extension )。 

4. 整数 算术 运算 中 的 溢出 

使 用 补 码 表示 法 ，n 位 可 表示 的 值 在 -2” 到 +2 和 一 -1 之 间 。 例 如 ， 使 用 4 位 可 以 表示 的 
数 的 范围 是 -8 到 +7， 如 图 1-3 所 示 。 当 算术 运算 的 实际 结果 超出 了 这 个 表示 范围 时 ， 就 发 生 
了 算术 溢出 。 

当 无 符号 数 相 加 时 ， 最 高 有 效 位 上 的 进位 输出 1 表明 发 生 了 溢出 。 但 是 当 对 有 符号 数 相 
加 时 ， 这 种 方法 并 不 总 是 正确 的 。 比 如 ， 当 使 用 补 码 表示 4 位 有 符号 数 时 ， 如 果 我 们 将 +7 和 
+4 相 加 ， 和 向 量 是 1011， 它 表示 数值 -5， 是 一 个 不 正确 的 结果 。 在 这 种 情况 下 ， 从 MSB (最 
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高 有 效 位 ) 位 置 上 得 到 的 进位 输出 位 是 0。 如 果 我 们 将 -4 和 -6 相 加 ， 得 到 0110 = +6， 也 是 
一 个 错误 的 结果 。 在 这 种 情况 下 进位 输出 位 为 1。 因此 ， 从 符号 位 得 到 的 进位 输出 位 的 值 不 能 
说 明 发 生 了 溢出 。 显 然 ， 只 有 当 两 个 加 数 有 相同 的 符号 时 ， 才 有 可 能 产生 溢出 。 具 有 不 同 符号 
的 数 相 加 时 不 会 产生 溢出 ， 因 为 结果 总 会 保持 在 可 以 表示 的 范围 之 内 。 
0010 (+2) 0100 (+4) 
* O011 (43) +1010 _ 6) 
0101 (+5) 1110 (-2) 


0111 (+7) 
+ 1101 (3) 


0100 (+4) 


1101 
Ql1ll1 


0100 (+4) 


0010 
+1100 


1 14410 (-2) 


0110 
+1101 


0011 (+3) 


1001 (-7) 1001 
-0004 (+1) | 


1000 


0010 
+ O00 


0101 (+5) 





图 1-6 补 码 的 加 法 和 减法 运算 
这 样 我 们 可 以 得 出 以 下 对 两 个 补 码 表示 的 数 相 加 时 检测 溢出 的 方法 。 测 试 两 个 加 数 的 符 
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号 以 及 结果 的 符号 。 当 两 个 加 数 具 有 相同 的 符号 ， 而 和 的 符号 与 加 数 的 符号 不 同时 就 发 生 了 
对 两 个 数 做 减法 的 时 候 ， 检 测 溢出 的 测试 方法 要 做 相应 的 修改 ， 但 是 这 个 方法 还 是 很 简 
单 的 ， 参 见习 题 1.10。 


1.4.2 浮 点 数 

到 目前 为 止 我 们 只 考虑 了 整数 ， 它 有 一 个 隐 含 的 二 进 制 小 数 点 在 数 的 最 右 端 ， 也 就 是 bo 
位 的 后 面 。 在 字 长 为 32 位 的 计算 机 中 ， 如 果 我 们 用 一 个 全 字 去 表示 一 个 补 码 形式 的 有 符号 整 
数 ， 数 的 表示 范围 是 -2” 到 +2”"-1。 在 十 进 制 中 ， 这 个 范围 比 -10 到 +10" 要 小 一 些 。 

如 果 假 设 隐 含 的 二 进 制 小 数 点 正好 在 符号 位 的 右 方 ， 也 就 是 32 位 表示 中 左 端的 位 ba 到 
by 之 间 ， 那 么 同样 的 32 位 模型 还 能 表示 在 -1 到 +1-2-1 范围 内 的 小 数 。 在 这 种 情况 下 ， 可 
以 表示 的 最 小 的 小 数 大 约 为 10-™。 

这 两 种 定点 ( fixed-point ) 数 表示 法 的 表示 范围 对 于 许多 科学 和 工程 计算 来 说 是 不 够 的 。 
为 方便 起 见 ， 我 们 希望 能 有 一 种 二 进 制 数 表示 法 ， 这 种 方法 能 够 容易 地 将 非常 大 的 整数 和 非常 
小 的 小 数 包含 进来 。 要 做 到 这 一 点 ， 二 进 制 小 数 点 的 位 置 应 该 是 可 变 的 ， 并 且 随 着 计算 的 进行 
可 以 自动 调整 ， 而 计算 机 必须 能 够 以 这 种 形式 表示 数字 并 对 其 进行 操作 。 在 这 种 情况 下 ， 我 们 
说 二 进 制 小 数 点 是 浮动 ( float ) 的 ， 并 称 数字 为 浮 点 数 (floating-point number )。 

因为 浮 点 数 中 二 进 制 小 数 点 的 位 置 是 可 以 变化 的 ， 所 以 在 浮 点 表示 中 必须 明确 指出 小 数 
点 的 位 置 。 例 如 ， 在 我 们 熟悉 的 十 进 制 科学 记 数 法 中 ， 数 字 可 以 记 为 6.0247 x 10”、3.7291 x 
10”、-1.0341 x 10"、-7.3000 x 10 等 。 我 们 说 这 些 数 具有 5 位 有 效 数 字 (significant digit ) 
的 精度 。 它 们 的 比例 因子 (scale factor ) 102、10 2 、102 和 10 汪 指示 了 相对 于 有 效 数 字 的 十 
进 制 小 数 点 的 实际 位 置 。 同 样 的 方法 也 可 以 用 来 表示 计算 机 中 的 二 进 制 浮 点 数 ， 只 不 过 要 用 2 
来 做 比例 因子 的 基数 。 因 为 基数 是 固定 的 ， 所 以 并 不 需要 在 表示 中 给 出 。 指 数 可 以 是 正 数 也 可 
以 是 负数 。 

总 的 来 说 ， 二 进 制 浮 点 数 可 以 表示 为 : 

e 数 的 符号 

e 一 些 有 效 位 

e 有 符号 的 比例 因子 指数 ( 隐 含 的 基数 为 2 ) 

已 经 制定 的 表示 32 位 浮 点 数 的 国际 IEEE( 电气 和 电子 工程 师 协会 ) 标准 使 用 1 个 符号 位 、 
23 个 有 效 位 以 及 8 位 比例 因子 的 有 符号 指数 ( 隐 含 的 基数 为 2 )。 在 十 进 制 中 ， 所 表示 的 数 的 
范围 大 约 在 土 I0 ”到 土 10” 范 围 内 ， 这 对 于 大 部 分 科学 与 工程 计算 来 说 足够 了 。IEEE 标准 还 
定义 了 64 位 的 表示 ， 以 提供 更 多 的 有 效 位 和 更 多 的 有 符号 指数 位 ， 从 而 得 到 更 高 的 精度 和 更 
大 的 取 值 范围 。 

浮 点 数 表示 和 浮 点 数 的 算术 运算 将 在 第 9 章 中 详细 介绍 。 附 录 B 到 EE 中 描述 的 一 些 商 
用 处 理 器 在 它们 的 指令 集中 包含 了 对 浮 点 数 的 操作 ， 并 有 一 些 专 门 用 于 保存 浮 点 数 的 处 理 器 
寄存 器 。 


1.5 字符 表示 


最 常见 的 字符 编码 方案 是 ASCII ( 美国 信息 交换 标准 代码 ) 字母 数字 字符 、 运 算 符 、 标 
点 符号 以 及 控制 字符 可 以 用 表 1-1 所 示 的 7 位 编码 来 表示 。 用 一 个 8 位 的 字 节 (byte ) 来 表示 
和 存储 一 个 字符 是 很 方便 的 。ASCII 编码 占据 较 低 的 7 位 ， 而 高 位 通常 设置 为 0。 注意 ， 当 字 
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母 与 数字 字符 的 编码 被 解释 为 无 符号 二 进 制 数 时 ， 它 们 是 按 递 增 顺 序 排列 的 ， 这 有 利于 字母 和 
数字 数据 的 排序 操作 。 
十 进 制 数字 0 到 9 的 ASCII 码 的 低 4 位 是 二 进 制 数字 系统 的 前 十 个 值 ， 这 4 位 编码 称 为 
二 进 制 编码 的 十 进 制 (binary-coded decimal，BCD ) 码 。 
表 1-1 7 位 ASCII 码 
位 位 置 654 










SOH DCI1 ! 1 
STX DC2 和 2 
ETX DC3 # 3 
EOT DC4 S$ 4 
ENQ NAK % 5 
ACK SYN & 6 
BEL ETB ， 7 
BS CAN 8 
HT EM 9 





OZZFrFARo -TATMNOIONNm>Y 
> 一 ~T"TN<X<x£E<CJI WAOw 

O88- 不 -Tm "0 Po Tp 
一 一 一 NAR<Enmmono 





NUL 空 /空闲 SI 移 进 

SOH 头 部 开始 DLE 数据 连接 出 口 
STX 文本 的 开始 DC1-DC4 设备 控制 
ETX 文本 的 结尾 NAK 非 应 答 

EOT 传输 结束 SYN 同步 空闲 
ENQ 询问 ETB 传送 的 块 结尾 
ACK 应 答 CAN 取消 (数据 错误 ) 
BEL 监听 信号 EM 媒介 结尾 

BS 退 格 SUB 专用 序列 

HT 水 平 制 表 符 ESC 出 口 

LF 换行 FS 文件 分 隔 符 
VT 垂直 制 表 符 GS 组 分 隔 符 

FF 换 页 RS 记录 分 隔 符 
CR 回 车 US 单元 分 隔 符 
SO 移出 DEL 删除 /空闲 


编码 格式 的 位 位 置 = [61514[3|21110| 


1.6 ”性 能 

衡量 一 台 计算 机 性 能 最 主要 的 因素 是 看 它 执行 程序 的 速度 有 多 快 。 一 台 计 算 机 执行 程序 
的 速度 受到 指令 集 、 硬 件 和 软件 ( 包括 操作 系统 和 实现 硬件 的 技术 ) 设计 的 影响 。 由 于 程序 通 
常 是 使 用 高 级 程序 设计 语言 编写 的 ， 所 以 性 能 也 会 受到 将 程序 转换 成 机 器 语言 的 编译 器 的 影 
响 。 本 书 不 描述 编译 器 或 操作 系统 的 细节 。 但 是 第 4 章 对 软件 进行 了 概述 ， 包 括 编译 器 与 操作 
系统 的 作用 的 介绍 。 本 书 只 关注 指令 集 、 存 储 器 、 处 理 器 与 VO 硬件 的 设计 ， 以 及 小 型 和 大 型 
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计算 机 的 组 织 结构 。1.2.2 节 描 述 了 高 速 缓存 是 如 何 提高 存储 器 性 能 的 。 在 第 2 章 中 还 会 讨论 
者 令 集 性 能 方面 的 内 容 。 在 这 一 节 里 ， 我 们 将 概括 介绍 技术 ， 以 及 处 理 器 和 系统 的 组 织 结构 是 
如 何 影 响 性 能 的 。 


1.6.1 技术 


用 于 在 单一 芯片 上 制造 处 理 器 电子 电路 的 超大 规模 集成 电路 ( Very Large Scale Integration， 
VLSI ) 技术 是 影响 机 器 指令 执行 速度 的 关键 因素 。 在 逻辑 电路 中 0 和 !1 状态 之 间 切 换 的 速度 
很 大 程度 上 取决 于 组 成 电路 的 晶体 管 尺寸 ， 小 的 晶体 管 切 换 速度 更 快 。 过 去 几 十 年 中 ,制造 技 
术 的 进步 使 得 晶体 管 的 尺寸 大 大 减 小 。 这 有 两 个 好 处 : 可 以 使 指令 更 快 地 执行 ; 在 一 个 芯片 上 
可 以 放置 更 多 的 晶体 管 ， 从 而 实现 更 多 的 逻辑 功能 以 及 更 大 的 存储 器 容量 。 


1.6.2 ”并行 性 

并 行 执行 多 项 操作 可 以 提高 性 能 。 并 行 性 可 以 在 不 同 的 级 别 上 实现 。 

1， 指令 级 并 行 性 

在 处 理 器 中 执行 一 个 指令 序列 最 简单 的 方法 是 在 下 一 条 指令 的 步骤 开始 之 前 完成 当前 指 
令 的 所 有 步骤 。 如 果 我 们 把 连续 指令 的 步 又 重 芋 执行 ， 那 么 总 的 执行 时 间 将 会 减少 。 例 如 ， 在 
对 当前 指令 的 寄存 器 操作 数 进行 算术 运算 的 同时 ， 可 以 从 存储 器 中 提取 下 一 条 指令 。 这 种 形式 
的 并 行 称 为 流水 线 (pipelining )。 流 水 线 技术 将 在 第 6 章 中 详细 讨论 。 

2. 多 核 处 理 器 

单个 芯片 上 可 以 放置 多 个 处 理 单元 。 在 技术 文献 中 ， 本 语 核心 (core ) 用 于 表示 芯片 上 的 
每 一 个 处 理 单元 ， 而 术语 处 理 器 则 指 的 是 整个 芯片 。 因 此 ， 用 双核 ( dual-core )、 四 核 (quad- 
core ) 和 和 八 核 ( octo-core ) 处 理 器 等 术语 来 分 别 表 示 有 两 个 、 四 个 和 八 个 核心 的 芯片 。 

3， 多 处 理 器 

计算 机 系统 中 可 能 包含 有 许多 个 处 理 器 ， 每 个 处 理 器 又 可 能 包含 有 多 个 核心 ， 这 种 系统 
称 为 多 处 理 器 (multiprocessor )。 这 些 系统 可 以 并 行 执行 许多 不 同 的 应 用 任务 或 者 并 行 执行 一 
个 大 型 任务 中 的 各 个 子 任务 。 在 这 样 的 系统 中 ， 所 有 处 理 器 通常 都 有 权 访 问 这 个 系统 中 的 所 有 
存储 器 ， 并 且 经 常 使 用 共享 存储 器 多 处 理 器 (shared-memory multiprocessor ) 这 一 术语 来 明确 
表示 这 一 点 。 这 些 多 处 理 器 系统 的 高 性 能 使 得 复杂 性 和 成 本 大 大 增加 ， 这 是 由 于 使 用 了 多 个 处 
理 器 和 存储 器 单元 以 及 更 复杂 的 互连网 络 。 

和 多 处 理 器 系统 相 比 ， 我 们 也 可 以 将 一 组 完整 的 计算 机 互 连 起 来 从 而 获得 较 高 的 总 计算 
能 力 。 这 些 计 算 机 通常 只 访问 它们 自己 的 存储 器 ， 当 它们 正在 执行 的 任务 需要 共享 数据 时 ， 用 
通信 和 网络 交换 消息 (message ) 的 方式 来 实现 。 这 一 特点 将 它们 与 共享 存储 器 的 多 处 理 器 区 别 
开 来 ， 因 此 将 它们 命名 为 消息 传递 多 计算 机 ( message-passing multicomputer )。 

多 处 理 器 和 多 计算 机 将 在 第 12 章 中 进行 描述 。 


1.7 发展 历程 


自 20 世纪 40 年 代 以 来 ， 已 开发 出 我 们 现在 所 知道 的 电子 数字 计算 机 。 在 电子 计算 机 被 
发 明之 前 有 一 段 漫 长 的 机 械 计 算 设 备 的 发 展 过 程 。 这 里 ， 我 们 只 简要 地 描述 一 下 计算 机 发 展 的 
历程 。 在 Hayes[1] 中 可 以 找到 更 多 的 内 容 。 

在 20 世纪 中 叶 之 前 的 300 年 里 ， 一 系列 由 齿轮 、 杠 杆 和 滑轮 构成 的 越 来 越 复杂 的 机 械 装 


17 





18 


Ll9 | 





14 : 第 1 章 计算 机 的 基本 结构 


置 被 用 来 执行 基本 的 加 、 减 、 乘 、 除 和 运算。 穿孔 卡片 上 的 孔 被 机 器 感知 后 自动 控制 一 系列 的 计 
算 ， 这 是 当时 提供 的 主要 编程 能 力 。 这 些 设备 可 以 计算 完整 的 对 数 表 和 使 用 多 项 式 近似 的 三 角 
函数 表 ， 输 出 结果 被 穿孔 在 卡片 上 或 打印 在 纸 上 。 在 20 世纪 30 年 代 末 40 年代 初 ， 机 电 继 
电器 设备 ， 比 如 那些 在 早期 电话 转换 系统 中 使 用 的 设备 ， 提 供 了 计算 机 构造 中 执行 逻辑 功能 
的 方法 。 

在 第 二 次 世界 大 战 期 间 ， 第 一 台电 子 计算 机 在 宾夕法尼亚 大 学 设计 制造 完成 ， 它 使 用 了 
为 无 线 电 和 军事 雷达 设备 开发 的 真空 管 技术 。 真 空 管 电路 用 来 执行 逻辑 运算 和 存储 数据 。 这 项 
技术 开创 了 电子 数字 计算 机 的 新 纪元 。 

计算 机 的 处 理 器 、 存 储 器 和 LO 设备 的 制造 技术 的 发 展 分 为 四 代 : 第 一 代为 1945 一 1955 
年 ; 第 二 代为 1955 一 1965 年 ; 第 三 代 是 1965 ~ 1975 年 ; 第 四 代 是 从 1975 年 至 今 。 


1.7.1 第 一 代 计 算 机 

程序 存储 的 核心 概念 是 在 第 一 台电 子 数字 计算 机 发 明 的 时 候 提 出 的 。 程 序 和 程序 中 使 用 
的 数据 被 放 在 同一 个 存储 器 中 ， 就 像 今天 这 样 。 这 使 得 改变 现 有 的 程序 与 数据 或 者 准备 和 装 
入 新 的 程序 与 数据 之 类 的 工作 变 得 非常 容易 。 汇 编 语 言 用 来 准备 程序 并 被 转换 成 机 器 语言 以 
便于 执行 。 

如 果 使 用 真空 管 技术 实现 逻辑 功能 ， 基 本 算术 运算 只 需要 执行 几 毫 秒 。 这 比 早 期 的 机 械 
和 机 电 技 术 的 速度 要 快 100 ~ 1000 倍 。 最 初 使 用 的 是 水 银 延 迟 线 存储 器 ， 而 IO 功能 是 由 类 
似 打 字 机 的 设备 完成 的 ， 还 开发 出 了 磁 心 存储 器 和 磁带 存储 设备 。 


1.7.2 第 二 代 计 算 机 

在 20 世纪 40 年 代 后 期 ，AT&T 贝尔 实验 室 ( AT&T Bell Laboratories ) 发 明了 晶体 管 ， 并 
迅速 用 它 取 代 了 真空 管 来 实现 逻辑 功能 。 这 一 基本 技术 的 转变 标志 着 第 二 代 计 算 机 的 开始 。 在 
第 二 代 计 算 机 中 广泛 使 用 了 磁 心 存储 器 和 磁 鼓 存储 设备 ， 磁 盘存 储 设 备 也 在 这 一 时 期 被 开发 出 
来 。 还 开发 出 了 最 早 的 高 级 语言 ， 例 如 Fortran， 使 得 应 用 程序 的 制作 更 为 容易 。 编 译 器 也 被 
开发 出 来 ， 它 将 高 级 语言 程序 翻译 成 汇编 语言 程序 ， 然 后 汇编 语言 程序 再 被 翻译 成 可 执行 的 机 
器 语言 形式 。 在 这 一 时 期 ，IBM 公司 成 为 主要 的 计算 机 制造 商 。 


1.7.3 第 三 代 计 算 机 

德州 仪器 (Texas Instruments ) 与 仙 童 半导体 ( Fairchild Semiconductor ) 公司 发 明了 在 一 
个 独立 的 硅 芯 片上 建造 许多 晶体 管 的 技术 ， 称 之 为 集成 电路 技术 ， 利 用 该 项 技术 可 以 建造 速度 
更 快 、 成 本 更 低 的 处 理 器 和 存储 元 件 。 集 成 电路 存储 器 开始 取代 磁 心 存 储 器 。 这 一 技术 的 发 展 
标志 着 第 三 代 计 算 机 的 开始 。 在 这 个 时 期 还 发 展 了 其 他 技术 ， 诸 如 微 程 序 设计 、 并 行 性 和 流水 
线 技术 。 操 作 系统 软件 可 以 使 若干 个 用 户 程序 有 效 地 分 享 计算 机 系统 。 还 开发 出 了 高 速 缓存 和 
虚拟 存储 器 技术 。 高 速 缓存 使 得 主 存储 器 看 起 来 比 实际 要 快 ， 而 虚拟 存储 器 使 得 主 存 储 器 看 起 
来 比 实际 要 大 - IBM 公司 的 System 360 大 型 机 和 数字 设备 ( Digital Equipment ) 公司 的 PDP 系 
列 小 型 机 主宰 了 第 三 代 计 算 机 的 商用 产品 市 场 。 


1.7.4 第 四 代 计 算 机 
到 20 世纪 70 年 代 初 ， 集 成 电路 制造 技术 已 经 达到 小 型 计算 机 中 的 整个 处 理 器 和 大 部 分 
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主 存储 器 都 可 以 在 单个 芯片 上 实现 的 程度 。 这 标志 着 第 四 代 计 算 机 的 开始 。 数 以 万 计 的 晶体 
管 可 以 放置 在 一 个 芯片 上 ， 超 大 规模 集成 电路 (VLSI) 这 一 名 词 描述 了 这 项 技术 。 一 个 完整 
的 处 理 器 可 以 在 一 个 芯片 上 制造 ， 这 就 是 微 处 理 器 。 一 些 公司 如 英特尔 ( Intel )、 国 家 半导体 
( National Semiconductor )、 摩 托 罗 拉 ( Motorola )、 德 州 仪器 ( Texas Instruments ) 和 超 微 半 导 
体 (Advanced Micro Devices，AMD ) 是 这 一 技术 的 推动 者 。 目 前 的 VLSI 技术 能 够 使 多 个 处 
理 器 (核心 ) 和 高 速 缓存 集成 到 单个 芯 户 上 。 

超大 规模 集成 电路 技术 的 一 种 特殊 形式 一 一 现场 可 编程 门 阵列 ( Field Programmable Gate 
Array，FPGA )， 使 系统 开发 者 能 够 在 单一 芯片 上 设计 和 实现 处 理 器 、 存 储 器 和 JIO 电路 ， 以 
满足 特定 应 用 的 要 求 ， 尤 其 是 在 嵌入 式 计算 机 系统 中 。 先 进 的 计算 机 辅助 设计 工具 使 人 们 可 以 
迅速 地 开发 基于 FPGA 的 产品 。Altera 和 Xilinx 等 公司 提供 了 这 项 技术 以 及 所 需要 的 软件 开发 
系统 。 

嵌入 式 计算 机 系统 、 便 携 式 笔记 本 电脑 以 及 多 功能 的 移动 电话 现在 被 广泛 使 用 。 台 式 个 
人 计算 机 和 工作 站 通过 有 线 的 或 无 线 的 局 域 网 和 因特网 互 连 起 来 ， 可 以 访问 数据 库 服 务 器 和 搜 
索引 擎 ， 从 而 提供 了 多 种 强大 的 计算 平台 。 

当 第 四 代 计 算 机 成 熟 时 ， 诸 如 并 行 性 、 分 级 存储 器 等 组 织 结构 的 概念 被 用 在 了 当今 的 高 
性 能 计算 系统 的 生产 中 。 在 高 性 能 计算 高 端 领域 的 超级 计算 机 和 网 格 计算 机 ， 被 用 于 天 气 预 
报 、 科 学 与 工程 计算 以 及 仿真 等 应 用 中 。 


1.8 ”结束语 


这 一 章 介 绍 了 计算 机 结构 和 操作 方面 的 基本 概念 ， 简 要 地 描述 了 机 器 指令 和 程序 ， 并 对 
二 进 制 数 的 加 法 和 减法 进行 了 解释 。 对 许多 与 这 些 主题 有 关 的 术语 都 给 出 了 定义 。 后 面 的 章节 
将 对 这 些 术 语 和 概念 做 出 详细 的 解释 ， 并 将 重点 阐述 体系 结构 和 硬件 。 


1.9 问题 解析 

本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解 决 这 样 的 问题 。 

问题 : 按照 图 1-2 中 所 示 的 部 件 之 间 的 数据 传输 以 及 一 些 简单 的 控制 命令 ， 列 出 执行 如 下 机 器 指令 
所 需 的 步 又: 

Load R2,LOC 

1.3 节 中 给 出 了 所 需 步骤 的 概述 。 假 设 包 含 该 指令 的 存储 单元 的 地 址 最 初 是 在 寄存 器 PC 中 。 

解答 : 所 需 的 步骤 是 : 

e 将 指令 字 的 地 址 从 寄存 器 PC 发 送 到 存储 器 中 ， 并 发 出 一 个 读 控制 命令 。 

e 等 待 所 请 求 的 字 从 存储 器 中 取 回 ， 然 后 把 它 装 入 寄存 器 IR 中 ， 它 在 IR 中 被 控制 电路 解释 ( 或 译 

码 ) 以 便 确 定 所 需 执 行 的 操作 。 

e 递增 寄存 器 PC 的 内 容 以 指向 存储 器 中 的 下 一 条 指令 。 

e 将 地 址 值 LOC 从 寄存 器 IR 中 的 指令 发 送 到 存储 器 并 发 出 一 个 读 控制 命令 。 

。 等 待 所 请 求 的 字 从 存储 器 中 取 回 ， 然 后 将 其 装 人 寄存 器 R2 中 。 

问题 : 一 个 程序 总 共有 500 条 指令 ， 其 中 有 一 个 包含 100 条 指令 的 循环 需要 执行 25 次 ， 在 这 种 情况 
下 ， 佑 算 一 下 使 用 高 速 缓存 对 性 能 所 产生 的 影响 。 计 算 没 有 高 速 缓存 与 有 高 速 缓存 时 程序 执行 时 间 的 比 
值 ， 这 个 比值 称 为 加 速 比 (speedup )。 

假设 访问 主 存储 器 需要 10 个 单位 的 时 间 ， 而 访问 高 速 缓存 需要 1 个 单位 的 时 间 。 为 了 方便 说 明 使 
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用 高 速 缓存 的 优势 ， 我 们 还 做 出 如 下 的 假设 以 简化 计算 : 
e 程序 的 执行 时 间 与 从 主 存储 器 或 高 速 缓存 中 提取 指令 所 需 的 总 时 间 量 成 比例 ， 忽 略 访问 操作 数 数 
据 的 时 间 。 
e 最 初 ， 所 有 指令 都 存储 在 主 存储 器 中 ， 高 速 缓存 是 空 的 。 
e 高 速 缓存 的 容量 足以 包含 所 有 的 循环 指令 。 
解答 : 没有 高 速 缓存 时 的 执行 时 间 为 : 
T=400 x 10+ 100 x 10x 25= 29 000 
有 高 速 缓存 时 的 执行 时 间 为 : 
Tache = S00 x 10+ 100 x 1 x 24=7 400 
所 以 ， 加速 比 为 


问题 : 将 以 下 各 对 十 进 制 数 转换 成 5 位 补 码 数 ， 然 后 对 每 一 对 进行 加 法 和 减法 运算 。 指 出 每 一 种 情 
况 中 是 否 会 发 生 溢出 。 

(a)7 和 13 

(b)-12 和 9 

解答 : 转换 与 运算 如 下 : 

(a)70=001112, 1310=01101; 

把 这 两 个 正 数 相 加 我 们 得 到 10100， 这 是 一 个 负数 ， 因 此 发 生 了 洲 出 。 

要 把 这 两 个 数 相 减 ， 我 们 首先 需要 求 出 01101 的 补 码 10011。 然 后 再 将 其 与 00111 相 加 得 到 11010， 
也 就 是 -6o， 这 是 正确 的 答案 。 

(b)—1210 = 10100,，9io = 01001; 

把 这 两 个 数 相 加 ， 得 到 11101 = -3,o， 这 是 正确 的 答案 。 

要 把 这 两 个 数 相 减 ， 我 们 首先 需要 求 出 01001 的 补 码 10111。 然 后 再 对 两 个 负数 10100 和 10111 进 
行 加 法 运算 得 到 01011 ， 这 是 一 个 正 数 ， 因 此 发 生 了 溢出 。 


习题 
[E] 1.1 对 在 1.3 节 中 讨论 的 机 器 指令 


T/T.acte = 3.92 


Add R4,R2,R3 
重复 例 1.1。 
[E] 1.2 对 在 1.3 节 中 讨论 的 机 器 指令 
Store R4,LOC 
重复 例 1.1。 
[M] 1.3(a) 对 任务 “将 存储 单元 A 和 B 中 的 内 容 相 加 ， 并 将 结果 放 到 单元 C 中 ”给 出 一 个 机 器 指令 的 
短 序列 。 指 令 
Load Ri, LOC 
及 
Store Ri, LOC 
是 用 于 在 存储 器 和 通用 寄存 器 之 间 传 递 数据 的 唯一 可 用 指令 。Add 指令 在 1.3 节 中 进行 了 描 
述 。 不 要 改变 单元 A 和 B 中 的 内 容 。 
(b ) 假设 Move 和 Add 指令 的 可 用 格式 为 : 
Move Locationl], Location2 
和 
Add Location1, Location2 
这 些 指令 将 在 第 二 个 位 置 Location2 中 的 操作 数 副本 传送 或 添加 到 第 一 个 位 置 Locationl 中 ， 
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覆盖 第 1 个 位 置 中 原 有 的 操作 数 内 容 。 两 个 操作 数 或 其 中 的 一 个 可 以 在 存储 器 中 也 可 以 在 
通用 寄存 器 中 。 是 否 可 以 使 用 较 少 的 这 种 类 型 的 指令 完成 (a ) 部 分 中 的 任务 ?如果 可 以 ， 
请 给 出 指令 序列 。 
[M] 1.4(a ) 某 程序 共有 300 条 指令 ， 其 中 有 一 个 包含 50 条 指令 的 循环 需要 执行 15 次 。 处 理 器 有 一 个 高 
速 缓存 ， 如 1.2.2 节 所 描述 。 在 主 存储 器 中 取出 与 执行 一 条 指令 需要 20 个 时 间 单 位 。 如 果 在 
高 速 缓存 中 能 找到 该 指令 ， 则 取出 与 执行 该 指令 只 需要 2 个 时 间 单 位 。 忽 略 访问 操作 数 数据 
的 时 间 ， 计 算 没 有 高 速 缓存 与 有 高 速 缓存 情况 下 程序 执行 时 间 的 比值 。 由 于 使 用 了 高 速 组 
存 ， 所 以 这 个 比值 称 为 加 速 比 。 假 设 高 速 缓存 最 初 是 空 的 ， 且 它 的 容量 足以 包含 这 个 循环 的 
所 有 指令 ， 而 程序 开始 时 所 有 指令 都 存储 在 主 存储 器 中 。 
(b) 把 (a) 部 分 中 的 常数 300、50、15、20 和 2 用 变量 wx、y、m 和 c 替换 ， 写 出 加 速 比 的 表达 式 。 
(c) 如 果 w=300，x=50，m=20，c=2,，y 取 什 么 值 可 以 使 加 速 比 为 5? 
(d ) 考虑 (b ) 部 分 中 得 到 的 加 速 比 表达 式 的 形式 ， 当 循环 迭代 的 次 数 》 越 来 越 大 时 ， 加 速 比 的 
上 限 是 多 少 ? 
[M] 1.5(a ) 在 1.2.2 节 中 讨论 过 处 理 器 高 速 缓存 。 假 设 一 个 程序 的 执行 时 间 与 指令 提取 时 间 成 比例 ， 再 
假设 从 高 速 缓存 中 取出 一 条 指令 要 花费 1 个 时 间 单 位 ， 但 从 主 存 中 取出 一 条 指令 要 花费 10 
个 时 间 单 位 。 此 外 ， 假 设 所 请 求 的 指令 在 高 速 缓存 中 找到 的 概率 为 0.96。 最 后 ， 假 设 如 果 一 
条 指令 在 高 速 缓存 中 没有 找到 ， 必 须 首 先 将 它 从 主 存储 器 中 读 取 出 来 送 到 高 速 缓存 中 ， 然 后 
再 从 高 速 缓存 中 取出 来 执行 。 计 算 没 有 高 速 缓存 与 有 高 速 缓存 情 况 下 程序 执行 时 间 的 比值 。 
由 于 使 用 了 高 速 缓存 ， 所 以 这 个 比值 称 为 加 速 比 。 
(b ) 如 果 高 速 缓存 的 大 小 加 倍 ， 同 时 假设 在 其 中 找 不 到 所 请 求 指令 的 概率 减 半 ， 对 于 双 倍 大 小 的 
高 速 缓存 重复 (a ) 部 分 中 的 问题 。 
[E] 1.6 扩充 图 1-4， 使 图 中 所 示 的 4 种 情况 都 能 包含 进位 输入 的 两 种 可 能 性 (0 或 1 )。 列 举 出 8 种 新 情 
况 的 和 位 与 进位 输出 位 。 
[M] 1.7 将 以 下 各 对 十 进 制 数 转换 成 5 位 补 码 数 ， 然 后 将 它们 相 加 。 判 断 在 每 种 情况 中 是 否 会 发 生 溢 出 。 
(a)4 和 11 
(b)6 和 14 
(c)-13 和 12 
(d)-4 和 8 
(e)-2 和 -9 
(f)-9 和 一 14 
[M] 1.8 重复 习题 1.7 的 描述 ， 对 各 对 十 进 制 数 做 减法 运算 ， 即 从 每 对 数 的 第 一 个 数 中 减 去 第 二 个 数 。 判 
断 在 每 种 情况 中 是 否 会 发 生 溢出 。 
[M] 1.9 一 个 字 节 存 储 单元 中 包含 模式 01010011， 当 这 个 模式 被 解释 为 二 进 制 数 时 ， 它 所 表示 的 十 进 制 
数值 是 多 少 ? 如 果 被 解释 为 ASCII 码 它 又 表示 什么 ? 
[M] 1.10 1.4.1 节 末 尾 给 出 了 当 两 个 补 码 数 相 加 时 的 一 种 检测 溢出 的 方法 。 描 述 一 下 当 这 两 个 数 相 减 时 如 
何 对 溢出 进行 检测 。 
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Computer Organization and Embedded Systems, Sixth Edition 


指令 集体 系 结构 


本 章 目标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 机 器 指令 和 程序 的 执行 

e 访问 寄存 器 和 存储 器 操作 数 的 寻 址 方式 

e 用 于 表示 机 器 指令 、 数 据 和 程序 的 汇编 语言 

e 堆栈 和 子 程序 

这 一 章 我 们 从 机 器 指令 集 的 角度 来 考虑 程序 在 计算 机 中 的 执行 方法 。 第 1 章 已 经 介绍 了 
存储 在 存储 器 中 的 程序 指令 和 数据 操作 数 的 一 般 概念 ， 在 本 章 中 我 们 将 讨论 指令 是 如 何 组 成 
的 ， 学 习 指令 序列 从 存储 器 传递 到 处 理 器 并 完成 给 定 任务 的 方法 ， 还 将 介绍 用 来 访问 存储 单元 
和 处 理 器 寄存 器 中 操作 数 的 常用 寻 址 方式 。 

这 里 强调 的 是 基本 概念 。 我 们 用 一 种 通用 的 方式 来 描述 机 器 指令 和 商用 处 理 咒 中 上 典型 的 
操作 数 寻 址 方式 。 本 章 将 介绍 足够 的 指令 和 寻 址 方式 ， 以 便于 能 够 给 出 一 个 针对 简单 任务 的 完 
整 且 真实 的 程序 。 这 些 通用 程序 用 汇编 语言 进行 了 说 明 ， 其 中 机 器 指令 和 操作 数 寻 址 信息 用 符 
号 名 来 表示 。 包 括 操作 数 寻 址 方式 在 内 的 完整 的 指令 集 通常 被 称 为 处 理 器 的 指令 集体 系 结构 
( instruction set architecture，ISA )。 在 本 章 中 我 们 对 基本 概念 进行 讨论 ， 不 需要 定义 完整 的 指 
令 集 ， 我 们 也 不 会 去 尝试 这 样 做 ， 而 是 给 出 足够 的 例子 来 说 明 一 种 典型 指令 集 的 功能 。 

在 本 章 和 第 3 章 介绍 的 概念 涉及 输入 /输出 技术 ， 这 些 概念 对 于 理解 计算 机 的 功能 是 非常 
必要 的 。 我 们 选择 了 一 种 通用 的 表示 方式 使 得 内 容易 于 阅读 和 理解 。 同 时 ， 这 种 方式 允许 进行 
一 般 性 的 讨论 而 不 受 特定 处 理 器 特性 的 限制 。 

这 些 概念 是 怎样 在 真实 的 计算 机 上 实现 的 呢 ? 这 很 有 趣 而 且 非 常 重要 ， 因 此 在 第 2 章 和 
第 3 章 中 ， 我 们 会 提供 四 个 流行 的 商用 处 理 器 的 例子 。 这 些 处 理 器 在 附录 B 到 E 中 进行 介绍 。 
附录 B 讨论 Altera 公司 的 Nios I 处 理 器 。 附 录 C 介绍 Freescale 半导体 公司 的 ColdFire 处 理 
器 。 附 录 D 讨论 ARM 公司 的 ARM 处 理 器 。 附 录 玉 介绍 Intel 公司 的 处 理 器 基本 体系 结构 。 
在 第 2 章 和 第 3 章 出 现 的 通用 程序 在 每 一 个 附录 中 都 会 用 具体 的 指令 集 表示 出 来 。 

读者 可 以 选择 一 种 处 理 器 来 学 习 相应 附录 中 的 内 容 ， 以 了 解 商 用 的 ISA 设计 。 但 是 ， 这 
些 附 录 中 的 知识 对 于 本 书 主体 内 容 的 理解 来 说 不 是 必要 的 。 

大 多 数 的 程序 是 用 高 级 语言 编写 的 ， 比 如 用 C、C++ 或 Java。 为 了 在 处 理 器 上 执行 高 级 语 
言 程序 ， 这 个 程序 必须 首先 被 翻译 成 该 处 理 器 上 的 机 器 语言 ， 这 由 编译 程序 完成 。 汇 编 语 言 是 
机 器 语言 的 一 种 易 读 的 符号 表示 形式 。 在 本 书 里 我 们 会 大 量 使 用 汇编 语言 ， 因 为 这 是 描述 计算 
机 工作 方式 的 最 好 方法 。 

本 章 中 ， 我 们 将 首先 讨论 指令 和 数据 是 如 何 存储 在 存储 器 中 的 以 及 如 何 访问 它们 以 进行 
处 理 。 


2.1 存储 单元 和 地 址 


我 们 首先 来 考虑 计算 机 的 存储 器 是 如 何 构成 的 。 存 储 器 是 由 几 百 万 个 存储 单元 ( cell ) 构 
成 的 ， 其 中 每 个 单元 可 以 存储 一 位 (bit) 具有 0 值 或 1 值 的 信息 。 由 于 单独 的 一 位 只 表示 信 
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息 中 一 个 非常 小 的 量 ， 所 以 很 少 单独 对 位 进行 处 理 。 常 用 的 方法 是 按 固 定 大 小 的 组 对 位 进行 处 
理 。 为 此 ， 存 储 器 被 组 织 成 适合 在 一 个 基本 操 | nn 位 | 
作 中 对 位 一 组 的 信息 进行 存储 或 检索 的 形式 。 +] 第 1 个 字 
每 一 个 n 位 组 称 为 一 个 字 ( word ), 称 为 字 长 Re py 
( word length )。 计 算 机 的 存储 器 可 以 用 图 表 方 
式 表 示 成 字 的 集合 ， 如 图 2-1 所 示 。 
现代 计算 机 的 字 长 范围 一 般 是 从 16 位 到 


64 位 。 如 果 一 台 计 算 机 的 字 长 是 32 位 ， 那 么 
如 图 2-2 所 示 ， 一 个 单独 的 字 就 能 够 存储 一 个 


32 位 的 有 符号 数 或 是 四 个 各 占 8 位 的 ASCII 
编码 字符 。 一 个 8 位 的 单元 叫做 一 个 字 节 EE 第 ;个 字 
(byte )。 机 器 指令 可 能 需要 用 一 个 或 多 个 字 来 
表示 。 在 描述 了 汇编 语言 级 的 指令 后 ， 在 后 面 
一 节 中 我 们 将 讨论 机 器 指令 是 如 何 被 编码 到 存 
储 器 的 字 中 的 。 
为 了 存储 或 检索 一 个 信息 项 需要 访问 存储 
器 ， 该 信息 项 无 论 是 一 个 字 或 是 一 个 字 节 , 对 | 十 一 地- 人 
于 每 一 项 的 位 置 都 要 有 具体 的 名 字 或 是 地 址 
(address )。 习惯 上 我 们 用 从 0 到 2:-!'(k 取 某 个 图 2-1 存储 器 中 的 字 
适当 的 值 ) 的 数字 作为 存储 器 连续 单元 的 地 址 。 因 此 存储 器 可 以 有 高 达 入 个 可 寻 址 单元 。2: 
个 地 址 构成 了 计算 机 的 地 址 空间 (address space )。 例 如 ， 一 个 24 位 的 地 址 生成 一 个 具有 2*” 
(16 777 216) 个 存储 单元 的 地 址 空间 。 这 个 数 通常 写成 16M， 这 里 1M 表示 数 22 (1 048 576) 。 
一 个 32 位 的 地 址 创建 出 具有 2” 或 者 4G 个 存储 单元 的 地 址 空间 ， 这 里 1G 表示 的 是 2”*。 其 他 ” [59] 
的 惯用 表示 法 就 是 用 K 来 表示 数 2"(1 024) ， 用 TT 表示 数 2”， 


| 32 位 


3 
E> 符号 位 : ba=0 代表 正 数 


ba=1 代表 负数 
a ) 一 个 有 符号 整数 


8 位 8 人 3 位 


人 
ASCI 字符 ASCII 字符 ASCII 字符 ASCII 字符 


b ) 四 个 字符 
图 2-2 一 个 32 位 字 中 编码 信息 的 例子 














2.1.1 按 字 节 寻 址 能 力 

现在 有 三 种 基本 的 信息 处 理 量 : 位 、 字 节 和 字 。 一 个 字 节 通常 为 8 位 ， 但 字 长 通常 的 范围 
是 从 16 位 到 64 位 。 为 存储 器 中 的 每 一 位 分 配 不 同 的 地 址 是 不 切实 际 的 做 法 。 实 际 上 大 部 分 的 
分 配方 法 是 将 连续 的 地 址 对 应 于 存储 器 中 连续 的 字 节 单元 。 这 是 大 多 数 现代 计算 机 中 使 用 的 分 
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配方 法 。 按 字 节 寻 址 存储 器 ( byte-addressable memory ) 就 使 用 了 这 种 分 配方 法 。 字 节 单元 具 
有 地 址 0. 1 2,…， 这样， 如 果 机 器 的 字 长 为 32 位， 那么 连续 的 字 被 分 配 到 地 址 0, 4, 8,… 
中 ， 其 中 每 个 字 包含 四 个 字 节 。 


2.1.2 大 端 和 小 端 分 配 
如 图 2-3 所 示 ， 有 两 种 在 字 中 分 配 字 节 地 址 的 方法 。 当 低 字 节 地 址 作为 一 个 字 中 的 最 高 有 

效 字 节 ( 最 左边 字 节 ) 时 采用 大 端 (big-endian ) 方法 。 而 小 端 (little-endian ) 方法 用 于 相反 
的 次 序 中 ， 其 中 低 字 节 地 址 作为 一 个 字 中 的 最 低 有 效 字 节 ( 最 右边 字 节 )。“ 最 高 有 效 ” 和 “最 
低 有 效 ” 是 指 当 这 个 字 表示 一 个 数 时 它们 在 分 配 位 中 所 占 的 权重 (以 2 为 权 )。 小 端 和 大 端 两 种 
分 配 法 都 在 商业 计算 机 中 使 用 。 在 这 两 种 情况 中 ， 都 将 字 节 地 址 0，4，8，… 作为 32 位 字 长 计 
算 机 的 存储 器 中 连续 字 的 地 址 。 这 些 地 址 也 可 以 用 作 访 问 存储 器 以 存储 或 检索 一 个 字 时 的 地 址 。 
字 地 址 


字 节 地 址 字 节 地 址 





a ) 大 端 分 配 b ) 小 端 分 配 
图 2-3 字 节 和 字 的 寻 址 


在 一 个 字 中 除了 指明 字 节 地 址 排序 外 ， 还 需要 说 明 每 一 位 在 一 个 字 节 或 一 个 字 中 的 标记 。 
最 常用 的 也 是 我 们 在 本 书 中 采用 的 方法 在 图 2-2a 中 给 出 ， 它 是 数字 型 数据 编码 最 常用 的 排序 
方法 。 这 种 排序 法 也 可 以 用 于 在 字 节 中 标记 位 ， 即 从 左 到 右 为 b;，be，…，bo。 


2.1.3” 字 的 对 齐 

在 32 位 字 长 的 情况 下 ， 如 图 2-3 所 示 ， 自 然 字 的 边界 发 生 在 地 址 0，4， 8，… 上 。 如 果 
字 位 置 的 开始 处 在 一 个 字 节 地 址 上 ， 这 个 地 址 又 是 一 个 字 中 字 节 数 的 整数 倍 ， 那 么 我 们 说 这 些 
字 的 位 置 具 有 对 齐 (aligned ) 地 址 。 因 为 实际 中 会 涉及 二 进 制 码 地 址 的 操作 ， 一 个 字 的 字 节 数 
是 2 的 客 次 方 ， 因 此 ， 如 果 字 长 是 16 位 (2 个 字 节 )， 对 齐 字 从 字 节 地 址 0，2，4，… 开始 ， 
而 如 果 字 长 是 64 位 (2 个 字 节 )， 对 齐 字 从 字 节 地 址 0，8，16，… 开始 。 

没有 一 个 基本 原则 性 的 约定 规定 字 不 能 从 任意 一 个 字 节 地 址 开始 。 如 果 一 个 字 可 以 从 任 
意 的 字 节 地 址 开始 ， 这 些 字 就 是 不 对 齐 ( unaligned ) 地 址 。 但 是 ， 在 大 多 数 情况 下 使 用 的 是 对 
齐 的 地 址 ， 我 们 将 会 在 第 8 章 中 看 到 ， 这 会 使 得 存储 器 操作 数 的 访问 操作 更 加 高 效 。 


2.1.4 访问 数 和 字符 
一 个 数 通 常 占用 一 个 字 ， 在 存储 器 中 可 以 通过 指明 字 的 地 址 对 其 进行 访问 。 同 样 ， 对 于 
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单个 字符 也 可 以 通过 它们 的 字 节 地 址 进行 访问 。 
为 了 编程 方便 ， 用 不 同 的 方法 在 程序 指令 中 指定 地 址 是 非常 有 益 的。 我 们 将 会 在 2.4 节 中 
讨论 这 个 主题 。 


2.2 存储 器 操作 


程序 的 指令 和 数据 操作 数 都 存储 在 存储 器 中 。 要 执行 一 条 指令 ， 处 理 器 控制 电路 必须 要 
将 包含 这 条 指令 的 单个 字 (或 多 个 字 ) 从 存储 器 传送 到 处 理 器 中 。 操 作 数 和 操作 结果 也 必须 
能 够 在 存储 器 和 处 理 器 之 间 传 送 。 因 此 ， 有 关 存 储 器 的 两 个 基本 操作 是 必需 的 ， 即 Read ( 读 ) 
和 Write ( 写 )。 

Read 操作 是 指 将 一 个 指定 存储 单元 中 的 内 容 拷贝 传送 到 处 理 器 中 ,存储器 中 的 内 容 保持 
不 变 。 在 开始 Read 操作 时 ， 处 理 器 向 存储 器 发 送 所 需 单元 的 地 址 并 且 要 求 读 取 它 的 内 容 ， 存 
储 器 读 出 存储 在 那个 单元 中 的 数据 并 将 其 发 送 给 处 理 器 。 

Write 操作 是 从 处 理 器 向 一 个 指定 的 存储 单元 传送 一 条 信息 ， 它 将 覆盖 这 个 单元 中 原 有 的 
内 容 。 为 了 初始 化 Write 操作 ， 处 理 器 向 存储 器 发 送 一 个 所 要 求 的 单元 地 址 ， 同 时 发 送 将 要 写 
入 这 个 单元 中 的 数据 。 然 后 存储 器 使 用 这 个 地 址 和 数据 来 完成 写 操作 。 

有 关 这 些 操作 的 硬件 实现 细节 将 在 第 5 章 和 第 6 章 中 论述 。 在 本 章 中 我 们 从 ISA 的 角度 
来 考虑 所 有 的 操作 ， 集 中 讨论 指令 和 操作 数 的 逻辑 处 理 。 


2.3 ”指令 和 指令 序列 

一 个 计算 机 程序 所 执行 的 任务 是 由 一 系列 小 的 执行 步 又 构成 的 ， 比 如 像 两 个 数 相 加 、 测 
试 特定 的 条 件 、 从 键盘 上 读 一 个 字符 或 是 发 送 一 个 字符 到 显示 屏 上 去 显示 等 。 一 台 计 算 机 必须 
具备 能 够 执行 以 下 四 种 类 型 操作 的 指令 : 

。 存储 器 和 处 理 器 寄存 器 之 间 的 数据 传送 

e 数据 的 算术 和 逻辑 运算 

e 程序 序列 化 和 控制 执行 

。 输入 /输出 传送 

我 们 首先 讨论 前 两 种 类 型 的 指令 。 为 了 便于 讨论 ， 需 要 先 介绍 一 些 标记 符号 。 


2.3.1 寄存 器 传送 标记 


我 们 需要 描述 信息 在 计算 机 中 从 一 个 单元 传送 到 另 一 个 单元 。 在 这 种 传送 中 涉及 的 单元 
可 以 是 存储 器 中 的 单元 、 处 理 器 寄存 器 或 是 TO 子 系统 中 的 寄存 器 。 大 多 数 情况 下 ， 我 们 用 方 
便 的 符号 名 来 识别 这 些 单元 的 位 置 。 例 如 ， 代 表 存 储 单元 地 址 的 名 字 可 能 是 LOC、PLACE、A 
或 者 VAR2。 处 理 器 寄存 器 的 预定 义 名 可 能 是 R0 或 者 R5， 而 IO 子 系统 中 的 寄存 器 可 能 由 像 
DATAIN 或 者 OUTSTATUS 这 样 的 名 字 来 识别 。 为 了 描述 信息 的 传送 ， 任 何 一 个 单元 中 的 内 容 
用 它 的 名 字 外 加 方 括号 来 表示 。 因 此 表达 式 

R2 +— [LOC] 

表示 存储 器 单元 LOC 中 的 内 容 被 传送 到 处 理 器 寄存 器 R2 中 。 

另 一 个 例子 是 将 寄存 器 R2 和 R3 的 内 容 相 加 ， 并 将 它们 的 和 放 到 寄存 器 R4 中 。 这 个 动 
作 表 示 为 : 

R4 * [R2] + [R3] 

这 种 标记 方式 就 是 所 谓 的 寄存 器 传送 标记 (Register Transfer Notation，RTN )。 要 注意 的 是 ， 在 
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RTN 表达 式 的 右边 总 是 表示 一 个 值 ， 而 左边 是 存放 这 个 值 的 单元 名 ， 将 用 这 个 值 覆 盖 该 单元 
中 的 原 有 内 容 。 

在 计算 机 术语 中 ,“ 传 送 ” 和 “移动 ”常用 于 表示 “复制 ”的 意思 。 从 源 (source ) 单元 
A 传输 数据 到 目的 〈destination ) 单元 B 意味 着 读 取 单 元 A 的 内 容 ， 然 后 将 其 写 到 单元 B 中 。 
在 这 个 操作 中 ， 只 有 目的 单元 的 内 容 被 改变 ， 源 单元 的 内 容 将 保持 不 变 。 


2.3.2 ”汇编 语言 符号 
我 们 需要 用 另 一 种 标记 符号 来 表示 机 器 指令 和 程序 。 为 此 ， 我 们 使 用 汇编 语言 ( assembly 
language )。 例 如 ， 将 存储 单元 LOC 的 内 容 传送 到 处 理 器 寄存 器 R2 中 , 产生 这 种 传送 操作 的 
通用 指令 将 使 用 下 面 的 语句 来 说 明 
Load R2,LOC 
执行 这 条 指令 后 LOC 的 内 容 不 改变 ,但 寄存 器 R2 中 原 有 的 内 容 被 覆盖 了 。 和 名字 Load 对 于 这 
条 指令 是 恰当 的 ， 因 为 从 存储 单元 中 读 取 的 内 容 被 装载 ( load ) 到 处 理 器 的 寄存 器 中 。 
第 二 个 例子 是 将 处 理 器 寄存 器 R2 和 R3 中 的 两 个 数 相 加 并 将 得 到 的 和 放 到 R4 中 ， 该 例 
子 可 以 用 汇编 语言 的 语句 描述 为 : 
Add R4,R2,R3 
在 本 例 中 ， 寄 存 器 R2 和 R3 保存 着 源 操作 数 ， 而 R4 则 为 目的 寄存 器 。 
一 条 指令 ( instruction ) 指定 了 一 个 将 要 执行 的 操作 及 其 包含 的 操作 数 。 在 上 面 的 例子 中 ， 
我 们 用 英语 单词 Load 和 Add 表示 所 需 的 操作 。 在 实际 的 〈 商 用 ) 处 理 器 的 汇编 语言 指令 中 ， 
这 样 的 操作 是 用 助 记 符 (mnemonic ) 来 定义 的 ， 助 记 符 通常 是 描述 这 些 操 作 的 单词 的 缩写 。 
例如 ，Load 操作 可 能 写成 LD， 而 将 一 个 字 从 处 理 器 寄存 器 传送 到 存储 器 的 Store 操作 ， 则 可 
能 被 写成 STR 或 ST。 对 于 给 定 的 操作 ， 不 同 处 理 器 的 汇编 语言 通常 使 用 不 同 的 助 记 符 。 为 了 
避免 在 这 个 较 早 的 阶段 了 解 特定 汇编 语言 的 细节 ， 在 本 章 中 我 们 将 会 继续 使 用 英语 单词 来 描 
述 ， 而 不 使 用 特定 处 理 器 的 助 记 符 。 


2.3.3 ”RISC 和 CISC 指令 集 


区 分 不 同 计 算 机 的 一 个 最 重要 的 特征 是 其 指令 的 本 质 。 在 现代 计算 机 的 指令 集 设 计 中 ， 
有 两 种 根本 不 同 的 方法 。 其 中 一 种 流行 的 方法 所 依据 的 前 提 是 ， 如 果 每 条 指令 恰好 占据 存储 器 
中 的 一 个 字 ， 则 可 以 获得 更 高 的 性 能 ， 并 且 执 行 指令 指定 的 算术 或 逻辑 运算 所 需要 的 所 有 操作 
数 都 已 经 在 处 理 器 的 寄存 器 中 。 这 种 方法 有 利于 处 理 单元 的 实现 ， 其 中 处 理 指 令 序 列 所 需要 的 
各 种 操作 可 以 用 流水 线 的 方式 重要 执行 ， 从 而 减少 程序 的 总 执行 时 间 ， 这 将 在 第 6 章 中 讨论 。 
每 条 指令 必须 刚好 放 人 一 个 单字 中 的 限制 降低 了 这 些 指令 的 复杂 度 ， 减 少 了 计算 机 指令 集中 所 
包含 的 不 同 指令 类 型 的 数目 。 这 样 的 计算 机 被 称 为 精简 指令 集 计 算 机 ( Reduced Instruction Set 
Computer, RISC )。 

相对 于 RISC 方法 的 另 一 种 方法 是 使 用 更 复杂 的 指令 ， 这 些 指令 可 能 跨越 多 个 存储 器 字 ， 
但 可 以 指定 更 复杂 的 操作 。 这 种 方法 在 20 世纪 70 年 代 RISC 方法 推出 之 前 是 很 盛行 的 。 尽 管 
复杂 指令 的 使 用 最 初 没有 确定 任何 特定 的 称呼 ,但 是 基于 这 个 思想 的 计算 机 后 来 被 称 为 复杂 指 
令 集 计算 机 ( Complex Instruction Computer，CISC )。 

由 于 RISC 风格 的 指令 集 比 较 简单 ， 并 且 易 于 理解 ， 所 以 我 们 将 首先 介绍 RISC 风格 的 指 
令 集 ， 然 后 再 讨论 CISC 风格 的 指令 集 并 说 明 这 两 种 方法 之 间 的 主要 区 别 。 
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2.3.4 ”RISC 指令 集 介 绍 

RISC 指令 集 的 两 个 关键 特性 是 : 

。 每 条 指令 为 一 个 字 长 

e@ 使 用 load/store 体系 结构 (load/store architecture )， 其 中 

和 只 能 通过 Load 和 Store 指令 来 访问 存储 器 操作 数 。 
@ 算术 或 逻辑 运算 中 涉及 的 所 有 操作 数 都 必须 在 处 理 器 寄存 器 中 ， 或 者 其 中 一 个 操作 
数 在 指令 字 中 被 明确 地 给 出 。 
在 程序 运行 之 初 ， 程 序 中 用 到 的 所 有 指令 和 数据 都 存储 在 计算 机 的 存储 器 中 。 此 时 ， 处 理 器 寄 
存 器 中 并 没有 包含 有 效 的 操作 数 。 如 果 希 望 操作 数 在 指令 使 用 之 前 就 已 经 在 处 理 器 的 寄存 器 
中 ,那么 就 有 必要 先 把 这 些 操作 数 放 到 寄存 器 中 。 这 个 任务 由 Load 指令 完成 ，Load 指令 会 将 
存储 单元 中 的 内 容 复 制 到 处 理 器 寄存 器 中 。Load 指令 的 格式 为 : 
Load 目的 操作 数 ， 源 操作 数 
或 者 更 具体 一 点 : 
Load 处理 器 寄存 器 ， 存 储 单元 

存储 单元 可 以 用 若干 种 方法 指定 。 寻 址 方式 (addressing mode ) 就 是 指 能 够 实现 这 一 目的 的 不 
同方 式 ， 我 们 将 在 2.4 节 中 讨论 。 

现在 我 们 来 考虑 一 个 典型 的 算术 运算 。 两 个 数 相 加 的 操作 是 任何 一 台 计 算 机 的 基本 功能 。 
高 级 语言 程序 中 的 语句 

C=A+B 
指示 计算 机 将 变量 A 和 B 中 的 当前 值 相 加 ， 并 将 得 到 的 和 赋值 给 第 三 个 变量 C。 当 包含 这 个 
语句 的 程序 被 编译 时 ， 三 个 变量 A、B、C 被 分 配 到 了 存储 器 的 不 同 单元 中 。 为 简单 起 见 ， 我 
们 将 这 些 单元 的 地 址 分 别称 作 A、B 和 C。 这 些 单元 的 内 容 表示 这 三 个 变量 的 值 。 因 此 ， 上 述 
高 级 语言 语句 需要 在 计算 机 中 完成 的 动作 是 : 
CC 二 [Al+[B] 

为 了 执行 这 个 动作 ， 从 存储 器 中 取出 存储 单元 A 和 了 B 中 的 内 容 并 将 其 传送 到 处 理 器 中 ,在 那 
里 对 它们 进行 求 和 计算 。 然 后 将 计算 结果 传送 回 存储 器 并 存储 在 单元 C 中 。 

上 述 语 句 所 需 的 动作 可 以 通过 一 系列 简单 的 机 器 指令 来 完成 。 我 们 选择 使 用 寄存 器 R2、 
R3、R4 以 及 四 条 指令 来 执行 这 个 任务 。 


Load R2, A 
Load R3, B 
Add R4, R2, R3 
Store R4, C 


我 们 称 Add 为 三 操作 数 (three-operand ) 指令 或 三 地 址 〈three-address ) 指令 上 且 具有 以 下 格式 : 
Add 目的 操作 数 ， 源 操作 数 1， 源 操作 数 2 
Store 指令 具有 以 下 格式 : 
Store ” 源 操 作 数 ， 目 的 操作 数 

其 中 源 操作 数 为 处 理 器 寄存 器 ， 目 的 操作 数 为 存储 单元 。 需 要 注意 的 是 ，Store 指令 中 源 操作 
数 和 目的 操作 数 的 定义 顺序 与 Load 指令 相反 ， 这 是 一 般 的 使 用 惯例 。 

注意 ， 如 果 其 中 一 个 源 操作 数 寄存 器 也 同时 用 作 存 放 结 果 的 目的 寄存 器 ， 那 么 只 需要 使 
用 两 个 寄存 器 R2 和 R3 就 可 以 完成 所 需 的 加 法 。 在 这 种 情况 下 加 法 可 以 按 如 下 方式 执行 : 

Add R3,R2, R3 
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最 后 一 条 指令 将 变 为 
Store R3,C 


2.3.5 ”指令 执行 和 线性 序列 

在 前 面 的 小 节 中 ， 我 们 使 用 任务 C = A + B 作为 例子 ，C = A + B 实现 为 C+ [A] + [B]。 
图 2-4 给 出 了 完成 这 个 任务 的 程序 段 存 放 在 计算 机 存储 器 中 的 情况 。 假 定 计算 机 的 字 长 为 32 
位 并 且 存 储 器 是 按 字 节 寻 址 的 。 程 序 中 的 四 条 指令 放 在 连续 的 字 单 元 中 ， 起 始 单 元 是 i。 由 于 
每 条 指令 是 4 字 节 长 ， 所 以 第 二 、 第 三 和 第 四 条 指令 的 起 始 地 址 分 别 为 i+ 4、i+ 8 和 i+ 12。 
为 了 简单 起 见 ， 假 定 所 需 的 存储 器 地 址 都 能 够 在 Load 和 Store 指令 中 直接 说 明 ， 虽然 这 在 包 
含 一 个 完整 的 32 位 地 址 时 是 不 可 能 的 。 我 们 将 在 2.4 节 中 解决 这 个 问题 。 


地 址 

从 这 里 开始 执行 一 i Load R2,A 
i+4 Load R3,B 
i+8 Add  R4,R2,R3 
i+12 Store R4,C 





图 2-4 一 个 完成 C 二 [A] + [B] 的 程序 


我 们 来 考虑 这 个 程序 将 如 何 执 行 。 处 理 器 中 包含 一 个 称 为 程序 计数 器 ( program counter， 
PC ) 的 寄存 器 ， 它 保存 着 将 要 执行 的 下 一 条 指令 的 地 址 。 当 开始 执行 一 个 程序 时 ， 它 的 第 一 
条 指令 地 址 (在 本 例 中 为 i 必须 被 放 人 PC 中 。 然 后 ， 处 理 器 的 控制 电路 利用 PC 中 的 这 个 
信息 ， 按 照 地 址 递增 的 顺序 一 次 一 条 地 取出 并 执行 指令 。 这 种 执行 方式 叫做 线性 序列 straight- 
line sequencing )。 在 每 条 指令 执行 时 ，PC 每 次 递增 4 以 指向 下 一 条 指令 。 这 样 当 i+ 12 单元 中 
的 Store 指令 被 执行 后 ，PC 中 包含 的 值 是 i+ 16， 它 是 下 一 个 程序 段 的 第 一 条 指令 的 地 址 。 

执行 一 条 给 定 的 指令 可 以 分 成 两 个 阶段 。 第 一 个 阶段 叫做 取 指 令 〈instruction fetch ) 阶段 ， 
在 该 阶段 中 ， 根 据 PC 中 的 地 址 从 存储 单元 中 取出 该 指令 。 这 条 指令 被 放 人 处 理 器 的 指令 寄存 
器 〈instruction register，IR ) 中 。 第 二 个 阶段 叫做 指令 执行 (instruction execute ) 阶段 ， 在 该 阶 
段 开始 时 ， 对 下 中 的 指令 进行 检查 以 确定 将 要 执行 哪 种 操作 。 然 后 处 理 器 执行 这 个 指定 的 操 
作 。 这 个 执行 过 程 涉 及 少量 步 台 ， 如 从 存储 器 或 处 理 器 寄存 器 中 提取 操作 数 ， 执 行 一 个 算术 或 
逻辑 运算 ， 然 后 将 结果 存放 到 目的 单元 中 。 在 这 个 两 阶段 过 程 中 的 某 个 点 上 ，PC 的 内 容 被 递 
增 以 指向 下 一 条 指令 。 当 一 条 指令 的 执行 阶段 完成 时 ，PC 中 包含 着 下 一 条 指令 的 地 址 ， 并 且 
一 条 新 指令 的 读 取 阶 段 又 可 以 开始 了 。 
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2.3.6 ”转移 

考虑 对 一 个 有 nn 个 数 的 列表 相 加 的 任务 。 图 2-5 中 的 程序 是 对 图 2-4 中 程序 的 推广 。 包含 
这 个 数 的 存储 单元 的 地 址 用 符号 NUM1、NUM2、…、NUMn 给 出 ， 并 且 使 用 单独 的 Load 
指令 和 Add 指令 将 每 个 数 累 加 到 寄存 器 R2 中 ， 当 所 有 的 数 都 加 完 以 后 ， 结 果 被 存放 在 存储 单 
元 SUM 中 。 

如 果 不 使 用 图 2-5 所 示 的 一 长 串 Load 和 Add 指令 ， 则 可 实现 一 个 程序 循环 ， 在 循环 中 指 
令 读 出 列表 中 的 下 一 个 数 并 将 其 加 到 当前 的 总 和 中 。 为 了 将 所 有 的 数 相 加 ， 循 环 必 须 执 行 与 列 
表 中 数 的 数量 相等 的 次 数 。 图 2-6 展示 了 所 需 程序 的 结构 。 这 个 循环 体 是 一 个 重复 执行 的 顺序 
指令 序列 。 它 的 开始 点 在 LOOP 单元 处 ， 结 束 点 在 指令 Branch_if [R2] > 0 处 。 每 经 过 一 轮 循 
环 ， 列 表 中 下 一 个 元 素 的 地 址 就 被 确定 下 来 ， 然 后 将 这 个 元 素 装 和 Rs 并 加 到 R3 中 。 操作 数 
的 地 址 可 以 用 多 种 方式 指出 ， 这 些 将 在 2.4 节 中 人 介绍。 现在， 我 们 把 注意 力 集中 在 如 何 创建 并 
控制 程序 的 循环 上 。 


Load  R2,NUMI 
Load “ R3, NUM2 















i 2 LOOF 确定 下 一 个 数 的 地 址 ， 
1 将 下 一 个 加 到 
程序 循环 中 ， 并 将 其 加 到 R3 中 
ni 
WE RA 
TT 一 一 一 
Nm | | NUML | | 
ww wo ME 
图 2-5 一 个 将 个 数 相 加 的 程序 图 2-6 用 一 个 循环 将 n 个 数 相 加 


假设 这 个 列表 中 元 素 的 数量 为 +，n 被 存储 在 存储 单元 N 中 ， 如 图 2-6 所 示 。 寄 存 器 R2 
被 当 作 一 个 计数 器 ， 用 来 确定 执行 循环 的 次 数 。 因 此 ， 单 元 N 中 的 内 容 在 程序 开始 时 被 装 入 
寄存 器 R2 中 。 然 后 在 循环 体内 部 ， 每 经 过 一 轮 循环 ， 指 令 
Subtract R2, R2, #1 
就 对 R2 的 内 容 减 1 (我 们 将 在 2.4.1 节 中 解释 符号 “#” 的 意义 )。 只 要 R2 的 内 容 大 于 0， 就 
重复 执行 这 个 循环 。 
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现在 我 们 来 介绍 转移 ( branch ) 指令 。 这 类 指令 将 一 个 新 的 地 址 加 载 到 程序 计数 器 中 ， 因 
此 ， 处 理 器 按 这 个 新 地 址 (该 地 址 被 称 为 转移 目标 ( branch target )) 取出 指令 并 执行 ， 而 不 是 
执行 在 连续 的 地 址 顺序 上 紧 挨 着 转移 指令 的 那个 单元 中 的 指令 。 条 件 转移 ( conditional branch ) 
指令 只 有 在 给 出 的 条 件 满足 时 才 产 生 一 个 转移 。 如 果 条 件 不 满足 ，PC 按 正常 的 方式 进行 递增 ， 
连续 地 址 顺序 的 下 一 条 指令 被 取出 并 被 执行 。 

在 图 2-6 的 程序 中 ， 指 令 

Branch if [R2] >0 LOOP 
是 一 个 条 件 转移 指令 ， 如 果 寄 存 器 R2 中 的 内 容 是 大 于 0 的 ， 就 跳 转 去 执行 LOOP 单元 中 的 指 
令 。 这 意味 着 只 要 在 列表 中 还 有 元 素 可 以 被 加 到 R3 中 ， 这 个 循环 就 要 重复 执行 。 在 对 遍 循环 
过 后 ，Subtract 指令 在 R2 中 产生 了 一 个 0 值 ， 因 此 转移 不 再 发 生 。 替 代 它 的 是 Store 指令 被 取 
出 并 被 执行 。 它 将 最 后 的 结果 从 R3 中 移 到 存储 单元 SUM 中 。 

这 种 首先 测试 条 件 然后 从 一 组 可 选 方式 中 选择 一 种 继续 执行 计算 的 能 力 比 仅 仅 完 成 循环 
控制 的 方式 有 更 大 的 应 用 价值 。 这 种 能 力 在 所 有 计算 机 的 指令 集中 都 可 以 找到 ， 并 且 它 对 于 大 
多 数 重要 任务 的 程序 设计 也 是 必需 的 。 

一 种 实现 条 件 转移 指令 的 方法 是 比较 两 个 寄存 器 的 内 容 ， 如 果 比 较 的 结果 满足 指定 的 要 
求 ， 则 跳 转 到 目标 指令 。 例 如 ， 一 条 实现 了 如 下 动作 的 指令 

Branch if [R4]>[R5] LOOP 
可 用 通用 的 汇编 语言 写作 
Branch greater than R4,R5,LOOP 
或 使 用 实际 的 助 记 符 写 作 
BGT R4,R5,LOOP 
它 将 寄存 器 R4 和 R5 的 内 容 进 行 比较 ， 且 没有 改变 其 中 任 一 个 寄存 器 的 内 容 。 如 果 R4 的 内 容 
大 于 R5 的 内 容 ， 则 产生 一 个 到 LOOP 的 跳 转 。 
另 一 种 实现 转移 指令 的 方法 使 用 了 条 件 码 的 概念 ， 我 们 将 在 2.10.2 节 中 讨论 。 


2.3.7 ”生成 存储 器 地 址 


我 们 回 到 图 2-6 中 ， 从 LOOP 开始 的 指令 块 的 目的 是 在 每 次 循环 时 ， 将 列表 中 连续 的 数 相 
加 。 因 此 ， 在 每 次 循环 中 ， 这 个 块 中 的 Load 指令 必须 访问 一 个 不 同 的 地 址 。 怎 样 来 指明 这 个 
地 址 呢 ? 存储 器 操作 数 地 址 无 法 在 循环 中 用 一 条 单独 的 Load 指令 直接 给 出 。 否 则 ， 它 将 需要 
在 每 次 循环 中 进行 修正 。 作 为 一 种 可 能 情况 ， 假 设 处 理 器 寄存 器 Ri 用 来 保存 一 个 操作 数 的 存 
储 器 地 址 。 如 果 在 进入 循环 之 前 ，Ri 用 NUMI1 作为 初始 装载 地 址 ， 以 后 每 次 循环 后 用 4 进行 
递增 ， 这 样 就 可 以 提供 所 需要 的 地 址 了 。 

在 这 种 情况 以 及 其 他 很 多 类 似 的 情况 下 ， 更 多 的 是 根据 需要 用 灵活 的 方式 去 指明 一 个 操 
作 数 的 地 址 。 一 台 计 算 机 的 指令 集 通 常 提供 了 多 种 这 样 的 方法 ， 称 之 为 寻 址 方式 (addressing 
mode )。 尽 管 各 计算 机 之 间 的 具体 情况 不 同 ， 但 是 其 基本 概念 是 相同 的 。 我 们 将 在 下 一 小 节 中 
讨论 这 些 问题 。 


2.4 寻 址 方式 


现在 我 们 已 经 看 到 了 一 些 汇 编 语言 程序 的 简单 例子 。 一 般 来 说 ， 一 个 程序 是 对 存储 在 计 
算 机 存储 器 中 的 数据 进行 操作 的 ， 这 些 数 据 可 以 用 多 种 方式 组 织 ， 而 这 些 方式 能 够 反映 出 信 
息 的 本 质 以 及 怎样 使 用 信息 。 程 序 员 使 用 数据 结构 ( data structure ) 如 链表 和 数组 去 组 织 用 
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于 计算 的 数据 。 

程序 通常 是 用 高 级 语言 编写 的 ， 在 高 级 语 Pe 
言 中 程序 员 可 以 方便 地 描述 将 要 在 各 种 数据 结 
构 上 执行 的 操作 。 当 把 一 个 高 级 语言 程序 翻 “立即 方式 
译 成 汇编 语言 时 ， 编 译 器 生成 适当 的 低级 指令 
序列 来 实现 所 需 的 操作 。 指 明 指 令 操 作 数位 置 
的 不 同方 法 称 为 寻 址 方式 。 在 这 一 节 中 ， 我 _ 寄 存 器 问 接 方式 
们 给 出 RISC 风格 处 理 器 中 的 基本 寻 址 方式 ， 
在 表 2-1 中 给 出 了 一 个 简要 的 描述 ， 同 时 表 中 - 营 朗 址 的 到 直方 式 
包含 了 每 一 种 方式 中 我 们 将 会 用 到 的 汇编 语法 。 人 全 站 
汇编 语法 定义 了 指定 指令 及 其 操作 数 寻 址 方式 Xe 人 
的 方法 ， 这 将 在 2.5 节 中 讨论 。 


2.4.1 变量 和 常数 的 实现 

变量 几乎 在 任何 一 个 计算 机 程序 中 都 会 存在 。 在 汇编 语言 中 ， 一 个 变量 通过 分 配 一 个 保 
存 该 变量 值 的 寄存 器 或 是 存储 单元 来 表示 。 这 个 值 可 以 根据 需要 使 用 适当 的 指令 来 改变 。 

在 图 2-5 的 程序 中 只 使 用 了 两 种 寻 址 方式 访问 变量 。 我 们 通过 指明 寄存 器 的 名 称 或 是 操作 
数 被 装 和 的 存储 单元 地 址 来 访问 操作 数 。 这 两 种 方式 的 具体 定义 是 : 

寄存 器 方式 〈register mode ) 一 一 操作 数 是 一 个 处 理 器 寄存 器 中 的 内 容 ， 在 指令 中 给 出 寄 
存 器 的 名 称 。 

绝对 方式 (absolute mode ) 
的 地 址 。 

由 于 在 RISC 风格 的 处 理 器 中 ， 一 条 指令 必须 放 到 一 个 单字 中 ， 所 以 能 用 来 指定 绝对 地 址 
的 位 的 数量 是 有 限 的 ， 如 果 字 长 为 32 位 则 这 个 数量 通常 就 是 16 位 。 为 了 生成 32 位 的 地 址 ， 
通常 通过 将 位 bi; 的 值 复 制 到 位 位 置 531-16 中 (符号 扩展 ) 来 将 这 个 16 位 的 值 扩展 为 32 位 。 
这 意味 着 可 以 用 这 种 方式 指定 一 个 绝对 地 址 ， 但 只 能 得 到 一 个 有 限 范围 的 完整 地 址 空间 。 我 们 
将 在 2.9 节 中 讨论 关于 如 何 指定 完整 的 32 位 地 址 的 问题 。 为 了 保持 例子 的 简洁 ， 现 在 我 们 假 
设 程序 中 所 有 存储 单元 的 地 址 都 以 16 位 来 指定 。 








操作 数 在 一 个 存储 单元 中 ， 指 令 中 明确 地 给 出 了 这 个 单元 


指令 
Add R4,R2,R3 
的 三 个 操作 数 都 使 用 了 寄存 器 寻 址 方式 。 寄 存 器 R2 和 R3 保存 着 两 个 源 操作 数 ， 而 R4 则 为 目 
的 寄存 器 。 


绝对 寻 址 方式 可 以 在 程序 中 表示 全 局 变量 。 例 如 在 高 级 语言 程序 中 有 这 样 一 个 声明 : 
Integer NUM1, NUM2, SUM; 

它 将 导致 编译 器 为 变量 NUM1、NUM2 和 SUM 分 别 分 配 一 个 存储 单元 。 每 当 它们 在 以 后 的 程 
序 中 被 引用 时 ， 编 译 器 就 产生 使 用 绝对 方式 去 访问 这 些 变量 的 汇编 语言 指令 。 

绝对 寻 址 方式 用 于 指令 

Load R2, NUMI 

该 指令 把 存储 单元 NUMI1 中 的 值 加 载 到 寄存 器 R2 中 。 

表示 数据 或 地 址 的 常数 几乎 在 任何 一 个 计算 机 程序 中 都 会 存在 。 这 样 的 常数 在 汇编 语言 
中 可 以 用 立即 寻 址 方式 来 表示 。 
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立即 方式 (immediate mode) 一 一 操作 数 在 指令 中 被 明确 地 给 出 。 
例如 指令 
Add R4,R6,200immediate 
表示 将 数值 200 与 寄存 器 R6 的 内 容 相 加 ， 并 把 结果 存 人 寄存 器 R4 中 。 在 汇编 语言 中 使 用 下 
标 来 说 明 立 即 方式 是 不 合适 的 。 常 用 的 约定 是 在 这 个 值 的 前 面 使 用 符号 “#” 来 说 明 这 个 值 是 
作为 立即 操作 数 使 用 的 。 因 此 ， 我 们 用 以 下 方式 写 出 上 面 那 条 指令 : 
Add R4,R6,#200 

在 下 面 的 寻 址 方式 中 ， 指 令 没 有 明确 地 给 出 操作 数 或 者 其 地 址 。 取 而 代 之 的 是 ， 指 令 中 
提供 了 一 些 信息 ， 当 指令 被 执行 的 时 候 ， 处 理 器 可 以 从 这 些 信息 中 推导 出 有 效 地 址 ( effective 
address，EA )， 然 后 再 利用 有 效 地 址 去 访问 操作 数 。 


2.4.2 ”间接 和 指针 

图 2-6 中 的 程序 方 要 在 每 次 循环 时 能 够 修改 存储 器 操作 数 的 地 址 。 提 供 这 一 功能 的 一 个 好 
方法 是 用 一 个 处 理 器 寄存 器 保存 操作 数 的 地 址 。 在 每 次 遍历 时 ， 改 变 (递增 ) 这 个 寄存 器 的 内 
容 ， 以 提供 列表 中 下 一 个 将 要 被 访问 的 数 的 地 址 。 这 个 寄存 器 担当 着 列表 指针 〈pointer ) 的 角 
色 ， 我 们 称 列表 中 的 每 个 数据 项 是 通过 使 用 寄存 器 中 的 地 址 间接 (indirectly ) 访问 的 ， 所 需 的 
功能 是 由 间接 寻 址 方式 提供 的 。 

间接 方式 ( indirect mode ) 一 一 操作 数 的 有 效 地 主 存储 器 
址 是 一 个 寄存 器 中 的 内 容 ， 而 这 个 寄存 器 在 指令 中 
给 出 。 

我 们 通过 在 指令 中 使 用 圆 括号 的 方法 来 表示 间 
接 寻 址 ， 在 圆 括号 中 放置 寄存 器 的 名 称 ， 如 图 2-7 BB 
和 表 2-1 中 给 出 的 示例 那样 。 

为 了 执行 图 2-7 中 的 Load 指令 ， 处 理 器 将 寄存 图 2-7 寄存 器 间接 寻 址 
器 Rs 中 的 值 作为 操作 数 的 有 效 地 址 。 它 请 求 一 个 读 
操作 从 存储 器 中 取出 单元 B 的 内 容 。 这 个 从 存储 器 中 读 出 的 值 是 所 需要 的 操作 数 ， 处 理 器 将 
它 加 载 到 寄存 器 R2 中 。 间 接 寻 址 也 可 以 通过 一 个 存储 单元 完成 ， 但 只 有 在 CISC 风格 的 处 理 
器 中 才 会 出 现 。 

间接 方式 和 指针 的 使 用 在 程序 设计 中 是 一 个 重要 且 强 大 的 概念 。 它 们 允许 使 用 相同 的 代 
码 来 对 不 同 的 数据 进行 操作 。 例 如 ， 图 2-7 中 的 寄存 器 R5 作为 Load 指令 的 一 个 指针 ， 用 来 
把 存储 器 中 的 操作 数 加 载 到 寄存 器 R2 中 。 有 一 段 时 间 Rs 可 能 指向 存储 器 中 的 单元 B。 然 后 ， 
程序 可 能 改变 R5 的 内 容 使 其 指向 不 同 的 单元 ， 此 时 相同 的 Load 指令 将 会 把 那个 单元 中 的 值 
加 载 到 R2 中 。 因 此 ， 只 需要 改变 指针 的 值 ， 就 可 以 方便 地 重用 包含 该 Load 指令 的 程序 段 。 

现在 我 们 回 到 图 2-6 对 一 个 列表 中 的 数 进行 加 法 操作 的 程序 中 。 间 接 寻 址 可 以 用 来 访问 列 
表 中 的 连续 的 数 ， 程 序 的 修改 结果 在 图 2-8 中 给 出 。 寄 存 器 R4 被 当 作 指向 列表 中 的 数 的 指针 ， 
操作 数 通 过 R4 被 间接 地 访问 。 程 序 的 初始 化 部 分 从 存储 单元 N 中 将 计数 器 的 值 n 加 载 到 R2 
中 。 然 后 使 用 Clear 指令 将 R3 的 内 容 清 为 0。 下 一 条 指令 使 用 立即 寻 址 方式 将 地 址 值 NUMI1 
放置 到 R4 中 ，NUMI1 是 列表 中 第 一 个 数 的 地 址 。 需 要 注意 的 是 ， 我 们 不 能 使 用 Load 指令 去 
加 载 所 需要 的 立即 值 ， 因 为 Load 指令 只 能 对 存储 器 源 操 作 数 进行 操作 。 取 而 代 之 ， 我 们 使 用 
Move 指令 





EE 


Move R4,#NUMI 
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Load 5 加 载 列 表 的 大 小 
Clear 将 和 初始 化 为 0 
Move 获取 第 一 个 数 的 地 址 
Load 获取 下 一 个 数 


Add 把 这 个 数 加 到 和 中 

Add 递增 指向 列表 的 指针 
Subtract 递减 计数 器 
Branch_if_[R2]>0 如 果 没 完成 就 跳 回 到 前 面 
Store 存储 最 终 的 和 





图 2-8 在 图 2-6 的 程序 中 使 用 间接 寻 址 


在 很 多 RISC 风格 的 处 理 器 中 ， 有 一 个 通用 寄存 器 专用 于 保存 常量 值 0。 通 常 ， 这 个 寄存 
器 是 R0。 它 的 内 容 不 能 通过 程序 指令 改变 。 在 我 们 关于 RISC 风格 处 理 器 的 讨论 中 ， 假 设 R0 
就 是 以 这 种 方式 使 用 的 。 然 后 上 面 的 Move 指令 可 以 这 样 实现 : 

Add R4, RO,HNUMI 
通常 情况 下 ， 为 了 程序 员 方 便 ，Move 作为 一 条 伪 指 令 ( pseudoinstruction ) 使 用 ,但 是 实际 上 
是 由 Add 指令 实现 的 。 
图 2-8 中 循环 体 里 的 前 三 条 指令 实现 了 图 2-6 中 从 LOOP 开始 的 未 说 明 的 指令 块 。 第 一 次 
循环 时 ， 指 令 
Load R5,(R4) 
从 单元 NUMI1 中 取出 操作 数 并 将 其 装 入 Rs 中 。 第 一 条 Add 指令 把 这 个 数 加 到 寄存 器 R3 的 
总 和 中 。 第 二 条 Add 指令 将 指针 R4 的 内 容 加 上 4， 这 样 在 第 二 次 通过 循环 执行 Load 指令 时 ， 
R4 中 将 包含 着 地 址 值 NUM2。 
作为 另 一 个 指针 的 例子 ， 再 来 看 C 语言 语句 
A=*B; 
这 里 B 是 一 个 指针 变量 ,符号 “*” 是 间接 访问 的 操作 符 。 这 个 语句 使 得 B 所 指向 的 存储 单元 
的 内 容 被 装 入 存储 单元 A 中 。 这 个 语句 可 以 被 编译 成 
Load R2, B 
Load R3, (R2) 
Store R3, A 
通过 寄存 器 进行 间接 寻 址 已 经 被 广泛 应 用 。 图 2-8 中 的 程序 展示 了 它 所 提供 的 灵活 性 。 


2.4.3” 变 址 和 数组 

下 一 个 我 们 将 要 讨论 的 寻 址 方式 提供 了 访问 操作 数 不 同 方式 的 灵活 性 。 它 对 于 列表 和 数 
组 的 处 理 很 有 用 。 

变 址 方式 (index mode) 一 一 操作 数 的 有 效 地 址 是 通过 将 一 个 寄存 器 中 的 内 容 加 上 一 个 常数 
值 而 生成 的 。 

为 了 方便 起 见 ， 我 们 将 这 种 方式 中 使 用 的 寄存 器 称 为 变 址 寄存 器 (index register )。 通 常 ， 
变 址 寄存 器 就 是 一 个 通用 寄存 器 。 我 们 表示 变 址 方式 的 符号 是 

X (Ri) 
这 里 X 表示 在 指令 中 包含 的 有 符号 整数 的 常数 值 ， 而 Ri 是 相关 寄存 器 的 名 字 。 该 操作 数 的 有 
效 地 址 用 下 面 的 式 子 给 出 : 
EA=X+[Ri] 
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寄存 器 的 内 容 在 生成 有 效 地 址 的 过 程 中 不 能 被 改变 。 

在 汇编 语言 程序 中 ， 每 当 需 要 一 个 常数 如 X 时 ， 都 可 以 直接 给 出 或 用 一 个 表示 数值 的 符 
号 名 给 出 。 在 这 种 方法 中 ， 一 个 符号 名 是 与 一 个 特定 的 数值 相关 的 ， 这 将 在 2.5 节 中 讨论 。 当 
指令 被 转换 成 机 器 码 时 ， 常 数 X 作为 指令 的 一 部 分 被 给 出 并 且 被 限制 为 比 计 算 机 的 字 长 要 少 
的 位 数 。 因 为 X 是 一 个 有 符号 的 整数 ， 所 以 在 将 它 与 寄存 器 中 的 内 容 相 加 之 前 ， 必 须 对 它 进 
行 符号 扩展 使 其 与 寄存 器 的 字 长 相同 〈 参 看 1.4 节 )。 

图 2-9 说 明了 两 种 使 用 变 址 的 方法 。 在 图 2-9a 中 ， 变 址 寄存 器 RS 中 包含 一 个 存储 单元 的 
地 址 ， 数 值 X 定义 了 一 个 从 这 个 地 址 到 操作 数位 置 的 偏 移 量 ( 也 称 为 位 移 量 )。 在 图 2-9b 中 具 
体 说 明了 所 使 用 的 另 一 种 方法 。 这 里 ， 常 数 X 相 当 于 一 个 存储 器 地 址 ， 而 变 址 寄存 器 中 的 内 
容 定义 了 一 个 到 操作 数 的 偏 移 量 。 无 论 在 哪 种 情况 下 ， 有 效 地 址 都 是 两 个 值 的 和 ， 其 中 一 个 值 
是 在 指令 中 明确 给 出 的 ， 另 一 个 值 是 保存 在 一 个 寄存 器 中 的 。 


Load R2,20(R5) 






名 


本 1000 


20 = 偏 移 量 


一 一 1020 






a ) 偏 移 量 作为 一 个 常量 给 出 


Load R2,1000(R5) 





二 全 5 
20 = 偏 移 量 
一 -om 
b ) 偏 移 量 在 变 址 寄存 器 中 
图 2-9 变 址 寻 址 


为 了 理解 变 址 寻 址 的 作用 ， 考 虑 一 个 有 关 学 生 选 修 课程 成 绩 表 的 简单 例子 。 假 设 这 个 成 
绩 表 开 始 的 位 置 在 LIST 处 ， 它 的 结构 如 图 2-10 所 示 。4 个 字 长 的 存储 块 构成 一 个 记录 ， 记 录 
中 存储 着 与 每 个 学 生 相 关 的 信息 。 每 个 记录 由 学 生 的 标识 号 (ID ) 和 学 生 在 三 次 测验 中 所 得 的 
分 数 构成 。 在 这 个 班 里 及 个 学 生 ， 这 个 值 被 存储 在 单元 N 中 ， 这 个 单元 N 紧 挨 在 这 张 表 
的 前 面 。 按 照 图 中 学 生 的 ID 号 和 考试 分 数 给 出 的 地 址 ， 假 设 该 存储 器 是 按 字 节 编 址 的 并 且 字 
长 是 32 位 的 。 

我 们 应 该 注意 到 ， 图 2-10 中 的 这 张 表 代表 着 一 个 n 行 4 列 的 二 维 数组 。 每 行 包含 一 个 学 


生 的 数据 项 ， 而 每 列 给 出 了 ID 号 和 考试 分 数 。 
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假设 我 们 想 要 计算 在 每 次 考试 中 所 有 得 分 的 总 和 ， 并 将 这 三 个 和 存储 在 存储 单元 SUMI、 


SUM2 和 SUM3 中 。 图 2-11 中 给 出 了 一 个 可 以 完 
成 这 项 任务 的 程序 。 在 循环 体内 ， 程 序 按照 图 2-9a 
中 描述 的 方式 使 用 变 址 寻 址 方式 去 访问 一 个 学 生 记 
录 中 三 个 得 分 中 的 每 一 个 分 数 。 寄 存 器 R2 被 用 作 
变 址 寄存 器 。 在 进入 循环 前 ，R2 被 设置 成 指向 第 
一 个 学 生 记录 ( 其 地 址 为 LIST ) 的 也 单元。 

在 第 一 次 循环 时 ， 第 一 个 学 生 的 考试 得 分 被 
加 到 了 保存 在 寄存 器 R3、R4 和 R5 的 和 中 ， 这 些 
值 在 初始 化 时 被 清 成 了 0。 这 些 得 分 可 以 使 用 变 址 
寻 址 方式 4 (R2)、8 (R2) 和 12 (R2) 进行 访问 。 然 
后 变 址 寄存 器 R2 用 16 进行 增值 ， 指 向 第 二 个 学 
生 的 ID 单元。 寄存 器 R6 初始 化 时 的 内 容 为 n 值 ， 
每 一 次 循环 结束 时 它 的 内 容 减 1。 当 R6 的 内 容 减 
到 0 时 ， 所 有 学 生 的 记录 就 都 被 访问 到 了 ， 并 且 循 


N 
LIST 
LIST+4 





ME 









LIST+8 









LIST+ 12 
LIST+ 16 


图 2-10 学 生成 绩 表 


环 结 束 。 在 那 之 前 ， 条 件 转移 指令 将 控制 返回 到 循环 的 开始 处 去 处 理 下 一 个 记录 。 最 后 三 条 指 
令 将 寄存 器 R3、R4 和 R5 中 的 累加 和 分 别传 送 到 存储 单元 SUM1、SUM2 和 SUM3 中 。 


Move R2, #LIST 
Clear 

Clear 

Clear 

Load 

Load 

Add 

Load 

Add R4, R4, R7 
Load R7, 12(R2) 
Add R5, RS5, R7 
Add R2, R2, #16 
Subtract R6, R6, #1 
Branch_if_[R6]>0 LOOP 
Store R3, SUMI1 
Store R4, SUM2 
Store R5, SUM3 





读 出 地 址 LIST 


加 载 n 值 

将 下 一 个 学 生 的 测验 1 成 绩 
加 到 部 分 和 上 

将 这 个 学 生 的 测验 2 成 绩 
加 到 部 分 和 上 

将 这 个 学 生 的 测验 3 成 绩 
加 到 部 分 和 上 

递增 指针 

递减 计数 器 

如 果 没 完成 就 跳 回 到 前 面 

保存 测验 1 的 总 和 

保存 测验 2 的 总 和 

保存 测验 3 的 总 和 


图 2-11 用 于 访问 图 2-10 中 学 生成 绩 表 的 变 址 寻 址 方式 


这 里 要 强调 的 是 ， 当 变 址 寄存 器 R2 在 变 址 寻 址 方式 中 用 来 访问 分 数 时 ， 其 内 容 是 不 能 够 
改变 的 。R2 的 内 容 只 能 被 循环 中 的 最 后 一 条 Add 指令 改变 ， 这 样 就 可 以 从 一 个 学 生 记录 转向 


下 一 个 学 生 记 录 。 


一 般 来 说 ， 变 址 方式 有 助 于 访问 那些 特定 的 操作 数 ， 这 些 操 作 数 的 存储 单元 是 用 相对 于 
保存 操作 数 的 数据 结构 中 的 一 个 参照 点 来 定义 的 。 在 刚刚 给 出 的 这 个 例子 中 ， 连 续 的 学 生 记录 
的 ID 单元 是 参考 点 ， 考 试 分 数 是 使 用 变 址 寻 址 方式 访问 的 操作 数 。 

我 们 已 经 介绍 了 变 址 寻 址 的 最 基本 的 形式 ， 即 用 寄存 器 Ri 和 偏 移 常 量 X。 在 实际 编程 中 
还 有 一 些 这 类 基本 形式 的 变形 ( 尽管 在 一 些 处 理 器 中 可 能 并 不 包含 它们 )， 它 们 对 存储 器 操作 


45 
48 
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数 的 访问 也 是 非常 有 效 的 。 例 如 ， 可 以 使 用 第 二 个 寄存 器 Rj 来 保存 偏 移 量 义 ， 在 这 种 情况 下 
我 们 可 以 将 变 址 方式 写成 : 
(RPR7) 
其 有 效 地 址 是 寄存 器 Ri 和 Ri 内 容 的 和 。 第 二 个 寄存 器 通常 称 作 基 址 (base ) 寄存 器 。 这 种 变 
址 寻 址 方式 在 访问 操作 数 方面 提供 了 更 多 的 灵活 性 ， 因 为 有 效 地 址 的 两 部 分 都 可 以 被 改变 。 
变 址 方式 还 有 一 种 使 用 两 个 寄存 器 加 上 一 个 常数 的 版 本 ， 这 可 以 表示 为 : 
X(RiRh 
在 这 种 情况 下 ， 有 效 地 址 是 常数 X 与 寄存 器 Ri 及 Ri 内 容 的 和 。 这 种 新 增加 的 灵活 性 在 访问 
一 条 记录 内 部 的 每 一 项 中 的 多 个 部 分 时 是 有 用 的 ， 这 里 一 个 项 的 开始 是 由 寻 址 方式 的 ( Ri, 
Rj ) 部 分 来 指明 的 。 
最 后 ， 我 们 应 该 注意 到 在 基本 的 变 址 方式 
X(RD 
中 ， 如 果 寄 存 器 的 内 容 等 于 0， 那 么 有 效 地 址 就 恰好 等 于 X 的 符号 扩展 值 。 这 与 绝对 方式 有 同 
样 的 效果 。 如 果 寄 存 器 R0 总 是 包含 值 0， 那 么 绝对 方式 可 以 简单 实现 为 
X(RO) 


2.5 汇编 语言 

机 器 指令 用 0 和 1 模式 来 表示 。 这 种 模式 在 讨论 或 准备 程序 时 是 很 不 便 的 。 因 此 ， 我 们 
使 用 符号 名 来 表示 这 些 模式 。 到 目前 为 止 , 已 经 使 用 了 自然 单词 如 Load、Store、Add 以 及 
Branch 作为 指令 操作 去 表示 相应 的 二 进 制 码 模式 。 当 为 一 台 指 定 的 计算 机 编写 程序 时 ， 这 些 
单词 通常 使 用 称 为 助 记 符 ( mnemonic ) 的 缩写 形式 来 代替 ， 比 如 LD、ST、ADD 和 BR。 在 识 
别 寄存 器 的 时 候 ， 用 简写 符号 也 是 很 有 用 的 ， 例 如 用 R3 表示 寄存 器 3。 最 后 ， 可 能 需要 定义 
像 LOC 这 样 的 符号 来 表示 一 个 特定 的 存储 单元 。 这 些 符号 名 以 及 使 用 规则 的 完整 集合 构成 了 
一 种 程序 设计 语言 ， 通 常 叫做 汇编 语言 (assembly language )。 使 用 助 记 符 以 及 描述 完整 的 指令 
和 程序 的 规则 集合 称 为 这 种 语言 的 语法 ( syntax )。 

使 用 汇编 语言 编写 的 程序 可 以 被 一 个 叫做 汇编 程序 (assembler ) 的 程序 自动 翻译 成 机 器 
指令 的 序列 。 这 个 汇编 程序 是 实用 程序 集中 的 一 个 ， 它 是 计算 机 系统 软件 的 一 部 分 。 汇 编程 序 
与 任何 其 他 的 程序 一 样 ， 作 为 一 个 机 器 指令 序列 被 存储 在 计算 机 的 存储 器 中 。 一 个 用 户 程序 通 
常 是 通过 键盘 输入 到 计算 机 中 ， 并 存储 在 存储 器 或 是 磁盘 上 的 。 在 这 点 上 ， 用 户 程序 被 简单 地 
看 作 是 字符 数字 流 的 一 个 集合 。 当 汇编 程序 执行 时 ， 它 读 取 用 户 程序 做 分 析 ， 然 后 生成 所 需要 
的 机 器 语言 程序 。 而 机 器 语言 程序 中 包含 着 将 要 被 计算 机 执行 的 用 0 和 1 模式 说 明 的 指令 。 按 
照 原始 的 字符 数字 文本 形式 组 成 的 用 户 程序 叫做 源 程序 (source program)， 汇 编 后 的 机 器 语言 
程序 叫做 目标 程序 (object program )。 我 们 将 在 2.5.2 节 和 第 4 章 中 讨论 汇编 程序 是 如 何 工 作 
的 。 首 先 给 出 一 些 汇 编 语言 本 身 的 外 部 特征 。 

一 台 给 定 计 算 机 的 汇编 语言 可 能 是 大 小 写 敏 感 的 也 可 能 不 是 ， 也 就 是 说 ， 它 可 以 区 别 也 
可 以 不 区 别 大写 和 小 写字 母 。 在 本 节 的 例子 中 ， 为 了 提高 文本 的 易 读 性 ， 我 们 使 用 大 写字 母 表 
示 所 有 的 名 称 和 标号 。 例 如 ， 将 Store 指令 写成 : 

ST R2,SUM 
助 记 符 ST 表示 这 条 指令 所 执行 操作 的 二 进 制 模式 ， 或 叫做 操作 ( OP ) 码 。 汇 编程 序 将 这 个 助 
记 符 翻译 成 这 台 计 算 机 能 够 识别 的 二 进 制 OP 码 。 
OP 码 助 记 符 后 面 最 少 跟随 一 个 空格 字符 或 制 表 符 ， 再 后 面 的 信息 给 出 了 具体 的 操作 数 。 
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在 上 面 的 Store 指令 中 ， 源 操作 数 在 寄存 器 R2 中 。 这 个 信息 后 面 跟随 的 是 目的 操作 数 的 具体 
说 明 ， 用 一 个 有 逗号 与 源 操作 数 隔 开 。 目 的 操作 数 在 存储 单元 中 ， 该 存储 单元 使 用 名 字 SUM 来 
表示 它 的 二 进 制 地 址 。 
因为 对 于 具体 操作 数 的 单元 可 以 用 多 种 寻 址 方式 来 说 明 ， 所 以 每 条 汇编 语言 指令 必须 说 
明 使 用 的 是 哪 一 种 方式 。 例 如 ， 一 个 数字 的 值 或 者 一 个 单独 使 用 的 名 字 ， 就 像 前 面 指令 中 的 
SUM， 可 以 用 来 表示 绝对 方式 。 数 字符 号 通常 表示 一 个 立即 操作 数 。 这 样 ， 指 令 
ADD R2,R3,#5 
表示 对 寄存 器 R3 的 内 容 加 上 数字 5 并 将 结果 放 到 寄存 器 R2 中 。 这 个 数字 符号 不 是 表示 立即 
寻 址 方式 的 唯一 方法 。 在 有 些 汇 编 语 言 中 ， 立 即 寻 址 方式 在 OP 码 的 助 记 符 中 指出 。 例 如 ， 前 
面 的 Add 指令 可 以 写成 
ADDI R2, R3, 5 
助 记 符 ADDI 中 的 后 缀 1 表示 第 二 个 源 操作 数 是 用 立即 寻 址 方式 给 出 的 。 
间接 寻 址 通常 由 放置 在 圆 括 号 中 的 代表 指向 操作 数 的 指针 的 名 字 或 符号 来 表示 。 例 如 ， 
如 果 寄 存 器 R2 包含 存储 器 中 一 个 数 的 地 址 ， 那 么 可 以 通过 如 下 指令 将 这 个 数 加 载 到 寄存 器 
R3 中 : 
LD R3, (R2) 


2.5.1 汇编 指示 
除了 为 在 程序 中 表示 指令 提供 一 种 机 制 以 外 ， 汇 编 语 言 还 允许 程序 员 说 明 将 源 程 序 翻译 
成 目标 程序 时 所 需要 的 其 他 信息 。 我 们 已 提 到 过 需要 







给 程序 中 使 用 的 任何 一 个 名 字 分 配 数值 。 假 设 名 字 100 
TWENTY 用 来 表示 值 20， 这 个 情况 可 以 通过 下 面 的 相 104 






等 (equate ) 语句 来 传递 到 汇编 程序 中 : 108 


Move R4,#NUMI1 







TEN LooP 112 
这 个 语句 在 目标 程序 运行 时 不 代表 一 条 将 要 被 执行 的 ue | Rs | 






指令 ,实际 上 ， 它 甚至 不 出 现在 目标 程序 中 。 它 只 是 oy 


Add R4, R4, #4 






简单 地 通知 汇编 程序 ， 名 字 TWENTY 无 论 出 现在 程 J 
序 的 任何 地 方 都 要 用 值 20 来 取代 。 这 样 的 语句 叫做 128 [Branch i R20 LOOP 





汇编 指示 (或 汇编 命令 )， 它 在 汇编 程序 将 源 程序 翻 人 
译 成 目标 程序 时 使 用 。 

为 了 进一步 说 明 汇 编 语言 的 使 用 ， 我 们 重新 考虑 
图 2-8 中 的 程序 。 为 了 在 计算 机 中 运行 这 个 程序 ， 需 
要 按照 汇编 语言 的 要 求 来 编写 源 代码 ， 具 体 说 明生 成 ”SUM 20% 
相应 目标 程序 所 需要 的 所 有 信息 。 假 设 它 的 每 条 指令 N 20% 
和 每 个 数据 项 都 占据 存储 器 中 的 一 个 字 。 另 外 假设 存 NUMI “08 
储 器 是 按 字 节 寻 址 的 并 且 它 的 字 长 是 32 位 。 还 假定 这 ”NUM2 212 
个 目标 程序 将 被 装载 到 主 存储 器 中 ， 如 图 2-12 所 示 。 
图 中 给 出 了 该 程序 为 了 运行 而 被 装载 后 ， 机 器 指令 和 
所 需 数据 项 占据 的 存储 器 地 址 。 如 果 汇编 程序 按 这 种 AU， go 
分 配方 式 产生 目标 程序 ， 它 需要 知道 : 

。 怎样 去 解释 名 字 。 图 2-12 图 2-8 中 程序 的 存储 器 分 配 
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e 在 存储 器 的 什么 位 置 存放 指令 。 

。 在 存储 器 的 什么 位 置 存放 数据 操作 数 。 

为 了 提供 这 些 信息 ， 源 程序 可 以 写成 如 图 2-13 所 示 的 形式 。 这 个 程序 以 汇编 指示 
ORIGIN 开始 ，ORIGIN 告诉 汇编 程序 在 存储 器 的 什么 位 置 存放 后 面 的 指令 。 它 指明 了 目标 程 
序 的 指令 将 要 被 装载 到 存储 器 中 起 始 地 址 为 100 的 连续 单元 中 。 跟 在 后 面 的 是 用 适当 的 助 记 符 
和 语法 编写 的 源 程序 指令 。 注 意 到 我 们 使 用 了 语句 

BGT R2,R0,LOOP 
来 表示 一 条 执行 下 面 这 个 操作 的 指令 : 
Branch if [R2]>0 LOOP 

第 二 个 汇编 指示 ORIGIN 告诉 汇编 程序 在 存储 器 的 什么 位 置 存放 后 面 的 数据 块 。 在 本 
例 中 ， 被 指明 的 单元 地 址 是 200。 这 是 要 用 来 存放 最 后 总 和 的 单元 。 通 过 使 用 汇编 指示 符 
RESERVE 来 为 总 和 保留 4 个 字 节 的 空间 。 在 地 址 204 中 的 下 一 个 字 ， 必 须 包 含 列表 中 条 目的 
数量 150。DATAWORD 指示 符 是 用 来 告诉 汇编 程序 这 个 要 求 的 。 下 一 个 RESERVE 指示 符 声 
明 预 留 一 个 600 字 节 的 存储 块 来 保存 数据 。 这 个 指示 符 并 不 能 将 任何 数据 加 载 到 这 些 单元 里 。 
只 有 使 用 输入 程序 ， 才 能 把 数据 装 和 人 该 存储 器 中 ， 就 像 我 们 将 在 第 3 章 中 解释 的 那样 。 源 程序 
中 最 后 一 个 语句 是 汇编 指示 END ， 它 告诉 汇编 程序 这 里 是 源 程序 正文 的 结束 点 。 


汇编 指示 


LD 
CLR 
MOV 
生成 机 器 指令 的 语句 LOOP: LD 
ADD 


ADD R4, R4, #4 
SUB R2, R2, #1 
BGT R2, R0, LOOP 
ST R3, SUM 


下 一 条 指令 


ORIGIN 200 
RESERVE 4 
DATAWORD 150 
RESERVE 600 
END 





图 2-13 图 2-12 中 程序 的 汇编 语言 表示 形式 


我 们 先前 已 经 描述 了 EQU 指示 符 是 如 何 将 一 个 指定 的 值 (可 能 是 一 个 地 址 ) 与 一 个 特 
定 的 名 字 关 联 起 来 的 。 在 图 2-13 中 阐明 了 一 种 把 地 址 与 名 字 或 标号 关联 起 来 的 不 同方 法 。 我 
们 可 以 为 任何 指令 和 存储 单元 中 的 数据 指定 一 个 存储 器 地 址 标号 。 汇 编程 序 自 动 为 这 个 标号 
分 配 该 单元 的 地 址 。 举 个 例子 ， 对 于 跟 在 第 二 个 ORIGIN 指示 符 之 后 的 数据 块 ， 我 们 用 标号 
SUM、N 和 NUM1 来 标记 。 因 为 ORIGIN 指示 符 之 后 的 第 一 个 RESERVE 语句 被 指定 了 标号 
SUM， 所 以 就 为 名 字 SUM 分 配 值 200。 每 当 在 程序 中 遇 到 SUM， 它 都 被 替换 成 这 个 值 。 这 种 
将 SUM 当 作 一 个 标号 的 方式 等 价 于 使 用 以 下 的 汇编 指示 : 
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SUM EQU 200 

类 似 地 ， 标 号 N 和 NUMI1 被 分 别 分 配 了 值 204 和 208， 因 为 它们 表示 两 个 紧 跟 在 地 址 为 200 
的 字 单 元 之 后 的 字 单 元 地 址 。 

大 多 数 汇编 语言 要 求 源 程序 中 的 语句 按 以 下 方式 编写 : 

标号 : ”操作 ”操作 数 注释 

这 四 个 字段 ( field ) 采用 适当 的 定 界 符 ， 可 能 用 一 个 或 多 个 空格 或 者 制 表 符 进 行 分 隔 。 标 号 可 
以 是 任意 与 存储 器 地 址 相关 的 名 字 ， 该 语句 所 生成 的 机 器 语言 指令 将 被 装 人 这 个 地 址 中 。 标 号 
也 可 以 与 数据 项 的 地 址 相关 联 。 在 图 2-13 中 有 四 个 标号 : LOOP、SUM、N 和 NUM1。 

操作 字段 中 包含 着 一 个 汇编 指示 符 或 所 需 指 令 的 OP 码 助 记 符 。 操 作 数 字段 包含 着 用 于 访 
问 操 作 数 的 寻 址 信息 。 注 释 字 有 段 将 被 汇编 程序 忽略 ， 它 是 使 程序 更 容易 理解 的 文档 。 

我 们 已 经 介绍 的 仅仅 是 汇编 语言 最 基本 的 特性 。 不 同 计算 机 在 这 些 语言 的 细节 和 复杂 程 
度 上 是 不 相同 的 。 | 


2.5.2 ”程序 的 汇编 和 执行 

用 汇编 语言 编写 的 源 程序 在 能 够 被 执行 之 前 必须 被 汇编 成 机 器 语言 的 目标 程序 。 这 是 由 
汇编 程序 来 完成 的 ， 它 将 用 在 机 器 指令 中 使 用 的 二 进 制 码 替换 所 有 表示 操作 的 符号 以 及 寻 址 方 
式 ， 并 且 将 所 有 的 名 字 和 标号 用 它们 的 实际 值 替 换 。 

汇编 程序 为 指令 和 数据 块 分 配 地 址 ， 起 始 地 址 由 汇编 指示 符 ORIGIN 给 出 。 它 还 插入 一 
些 可 能 是 在 DATAWORD 命令 中 给 出 的 常数 ， 并 按 RESERVE 命令 的 要 求 保 留存 储 空间 。 

汇编 处 理 的 一 个 关键 部 分 是 确定 那些 将 要 用 来 替代 名 字 的 值 。 在 某 种 情况 下 ， 名 字 的 值 
是 由 EQU 指示 符 说 明 的 ， 这 是 一 种 简单 的 方式 。 在 另 一 些 情况 下 ， 名 字 是 由 一 条 给 定 指令 的 
标号 字段 定义 的 ， 用 这 种 名 字 表 示 的 值 是 由 汇编 后 的 目标 程序 中 这 条 指令 所 在 的 位 置 决定 的 。 
因此 ， 汇 编程 序 必须 在 生成 连续 指令 的 机 器 码 时 时 刻 注意 地 址 的 值 。 例 如 ， 图 2-13 程序 中 的 
名 字 LOOP 和 SUM 将 分 别 被 分 配 的 值 是 112 和 200。 

在 有 些 情 况 下 ， 汇 编程 序 不 直接 用 一 个 地 址 的 实际 值 去 取代 表示 这 个 地 址 的 名 字 。 例 如 ， 
在 一 条 转移 指令 中 ， 用 于 指明 将 要 转 入 的 那个 位 置 ( 转移 目标 ) 的 名 字 不 用 实际 的 地 址 蔡 换 。 
转移 指令 通常 是 在 机 器 码 中 用 指定 转移 目标 的 方法 来 实现 的 ， 转 移 目标 被 指定 为 从 程序 计数 
器 中 的 当前 地 址 到 目标 指令 之 间 的 距离 ( 以 字 节 为 单位 )。 汇 编程 序 计算 转移 偏 移 量 (branch 
offset )， 偏 移 量 可 正 可 负 ， 并 将 它 放 进 机 器 指令 中 。 我 们 将 在 2.13 节 中 展示 转移 指令 是 如 何 实 
现 的 。 

汇编 程序 将 目标 程序 存储 在 计算 机 中 可 用 的 辅助 存储 设备 中 ， 通 常 是 磁盘 。 在 目标 程序 
开始 执行 之 前 ， 它 必须 被 装 人 计算 机 的 主 存储 器 中 。 为 了 完成 这 项 工作 ， 另 一 个 叫做 装载 程序 
( loader ) 的 实用 程序 必须 已 经 在 存储 器 中 了 。 执 行 这 个 装载 程序 就 是 运行 一 系列 的 输入 操作 ， 
将 机 器 语言 程序 从 磁盘 中 传送 到 存储 器 中 指定 的 位 置 上 。 装 载 程序 必须 知道 这 个 程序 的 长 度 和 
将 要 存放 它 的 存储 器 地 址 。 汇 编程 序 通常 把 这 些 信息 放 在 目标 代码 的 头 部 。 装 载 完 目标 代码 
后 ， 装 载 程序 就 转移 到 将 要 执行 的 第 一 条 指令 处 开始 执行 目标 程序 ， 将 要 执行 的 第 一 条 指令 可 
能 由 一 个 地 址 标号 如 START 来 识别 。 汇 编程 序 把 这 个 地 址 放 到 目标 代码 的 头 部 供 装 载 程序 在 
执行 时 使 用 。 

当 目 标 程 序 开始 执行 后 ， 它 会 一 直 进 行 到 结束 ， 除 非 在 程序 中 有 逻辑 性 错误 。 用 户 必 须 
能 够 容易 地 发 现 错误 ， 汇 编程 序 只 能 够 监测 并 报告 语法 错误 。 为 了 帮助 用 户 发 现 其 他 的 程序 设 
计 错 误 ， 系 统 软件 通常 提供 一 个 调试 ( debugger ) 程序 。 这 个 程序 使 用 户 能 够 在 一 些 感 兴趣 的 
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点 上 停止 目标 程序 的 运行 ， 去 检查 各 个 处 理 器 寄存 器 和 存储 单元 的 内 容 。 
在 这 一 小 节 中 ， 我 们 介绍 了 一 些 关于 程序 汇编 和 运行 的 重要 问题 。 第 4 章 将 会 更 详细 地 
讨论 这 些 问题 。 


2.5.3” 数 的 表示 
在 处 理 数值 的 时 候 ， 使 用 熟悉 的 十 进 制 记 数 法 通常 是 很 方便 的 。 当 然 ， 这 些 值 是 用 二 进 
制 方式 存储 在 计算 机 中 的 。 有 些 情况 下 ， 直 接 指定 二 进 制 模式 是 比较 方便 的 。 大 多 数 汇编 程序 
允许 数值 在 汇编 语法 定义 的 约定 下 有 多 种 表示 方式 。 例 如 ， 考 虑 数字 93， 它 用 8 位 二 进 制 数 
表示 为 01011101。 如 果 这 个 值 被 当 作 立即 操作 数 使 用 ， 它 可 以 作为 一 个 十 进 制 数 给 出 ， 就 像 
如 下 的 指令 : 
ADDI R2,R3,93 
或 者 用 一 个 汇编 程序 指定 的 前 级 符号 ( 比如 百 分 号 ) 识别 成 二 进 制 数 ， 比 如 : 
ADDI R2,R3,%01011101 
二 进 制 数 可 以 写成 比较 紧凑 如 十 六 进 制 (hexadecimal 或 hex ) 方式 的 数 ， 这 时 数 的 四 位 
可 以 用 一 位 十 六 进 制 数字 表示 。 前 十 个 模式 0000、0001、0010、…、1001， 称 为 BCD (binary- 
coded decimal， 二 进 制 编码 的 十 进 制 ) 码 ， 用 数 0、1、…、9 表示 ， 其 余 的 六 个 4 位 模式 
1010、1011、…、1111 用 字母 A、B、…、F 表示 , 在 十 六 进 制 表 示 法 中 ， 十进制 数 93 变 成 
5D。 在 汇编 语言 中 ， 常 常用 一 个 0x ( 像 C 语言 中 一 样 ) 或 者 美元 符号 做 前 缀 来 表示 一 个 十 六 
进 制 数 ， 这 样 前 面 的 指令 应 写成 : 
ADDI R2, R3, 0x5D 


2.6 ”堆栈 


被 程序 操作 的 数据 可 以 用 多 种 方法 来 组 织 。 我 们 已 经 接触 了 像 表 这 样 的 数据 结构 ， 现 在 
来 考虑 男 一 种 重要 的 数据 结构 堆栈 ( 简称 栈 )。 堆 栈 ( stack ) 是 一 个 数据 元 素 表 ， 其 中 的 
元 素 通常 是 字 ， 它 具有 的 访问 约束 是 数据 元 素 只 能 从 表 的 一 端 移 进 或 移出 。 这 一 端 叫做 该 栈 的 
栈 顶 ， 另 一 端 为 栈 底 。 这 种 结构 有 时 也 称 为 下 推 (pushdown ) 栈 。 设 想 自助 餐厅 里 的 一 至 盘 
子 ， 客 户 从 这 营盘 子 的 顶部 拿 走 新 盘子 ， 而 清洗 干净 的 盘子 又 被 添加 到 这 又 盘 子 的 顶部 。 后 进 
先 出 ( last-in-first-out，LIFO ) 栈 也 是 用 来 描述 这 种 类 型 的 存储 机 制 的 ， 即 表示 最 后 放 人 堆栈 
中 的 数据 项 在 检索 开始 时 是 第 一 个 被 取出 的 。 术 语 压 入 (push ) 和 弹出 〈pop ) 分 别 用 来 描述 
向 栈 中 放 入 一 个 新 的 数据 项 和 从 栈 顶 取出 一 个 数据 项 。 

在 现代 计算 机 中 ， 栈 是 用 主 存储 器 中 的 一 部 分 来 实现 的 。 一 个 叫 栈 指针 ( stack pointer， 
SP ) 的 处 理 器 寄存 器 被 用 来 指向 一 个 特定 的 称 为 处 理 器 栈 ( processor stack ) 的 栈 结构 ， 它 的 
用 法 稍 后 会 解释 。 | 

数据 可 以 存储 在 一 个 栈 中 ， 其 中 连续 的 元 素 占 据 连 续 的 存储 单元 。 假 设 第 一 个 元 素 放 在 
BOTTOM 位 置 上 ， 当 新 的 元 素 被 压 进 栈 时 ， 它 们 被 放置 在 连续 的 低地 址 单元 中 。 在 我 们 的 讨 
论 中 ,使 用 了 一 个 按照 碱 小 存储 器 地 址 方向 进行 增长 的 栈 ， 这 是 一 种 惯用 的 方式 。 

图 2-14 给 出 了 一 个 保存 字数 据 项 的 堆栈 示例 。 它 所 保存 的 数值 以 43 为 栈 底 , -28 为 栈 顶 。 
栈 指 针 ( SP ) 用 来 跟踪 栈 中 元 素 地 址 ， 它 在 任何 时 候 都 指向 栈 顶 。 假 设 一 个 按 字 节 寻 址 的 存 
储 器 具有 32 位 的 字 长 ， 压 栈 操 作 可 以 这 样 实现 : 

Subtract SP, SP, #4 
Store Rj, (SP) 
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这 里 Subtract 指令 从 SP 的 内 容 中 减 去 4， 再 把 结果 放 回 到 SP 中 。 假 设 这 个 将 要 被 压 人 栈 中 的 
新 项 在 处 理 器 寄存 器 Ri 中 ， 则 Store 指令 会 把 这 个 值 放 到 栈 中 。 这 两 条 指令 将 Rj 中 的 字 找 由 
到 该 栈 的 栈 顶 上 ， 在 存储 ( 压 入 ) 操作 之 前 对 栈 指针 减 4。 弹 出 操作 可 以 这 样 实现 : 

Load Rj, (SP) 

Add SP, SP, #4 
这 两 条 指令 从 栈 中 将 栈 顶 值 加 载 ( 弹出 ) 到 寄存 器 Rj 中 ， 然 后 将 栈 指针 加 4， 使 其 指向 新 的 


栈 顶 元 素 。 图 2-15 给 出 了 在 图 2-14 的 栈 中 完成 这 些 操作 的 效果 。 





当前 栈 顶 元 素 


a ) 将 Rj 中 的 内 容 压 入 栈 之 后 b ) 弹出 栈 顶 元 素 到 Rj 中 之 后 
图 2-15 对 图 2-14 中 的 栈 进 行 栈 操作 的 效果 
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2.7 子 程 序 


在 一 个 给 定 的 程序 中 ， 常 常 需要 对 不 同 的 数据 多 次 执行 同一 个 特定 的 任务 。 比 较 明 智 的 
做 法 是 把 这 个 任务 实现 为 一 个 指令 块 ， 每 次 要 执行 任务 的 时 候 就 运行 该 指令 块 。 这 样 的 指令 块 
通常 叫做 子 程序 ( subroutine )。 例 如 ， 一 个 子 程 序 可 以 求 一 个 数学 函数 的 值 或 者 将 一 列 数 值 按 
照 递 增 或 递减 的 顺序 排序 。 

虽然 可 以 在 程序 中 任何 需要 的 地 方 复 制 构成 子 程序 的 指令 块 ， 但 是 为 了 节省 空间 ， 我 们 
只 需 在 存储 器 中 存放 一 份子 程序 的 拷贝 ， 当 任何 程序 需要 使 用 该 子 程序 时 ， 只 要 简单 地 跳 转 到 
这 个 子 程序 的 起 始 位 置 即 可 。 当 一 个 程序 将 控制 转移 到 一 个 子 程序 时 ， 我 们 称 其 为 调用 ( call ) 
子 程序 。 执 行 这 个 转移 操作 的 指令 叫做 调用 ( Call ) 指令 。 

一 个 子 程 序 被 执行 后 ， 调 用 它 的 程序 必须 能 够 恢复 执行 紧 跟 在 这 条 调用 指令 后 面 的 指 
令 。 我 们 将 此 称 为 子 程序 返回 (return ) 到 调用 它 的 程序 中 ， 这 可 以 通过 在 子 程序 中 执行 一 条 
Return 指令 的 方式 来 完成 。 因 为 子 程序 可 能 在 一 个 调用 程序 的 任何 位 置 上 被 调用 ， 所 以 必须 准 
备 好 返回 到 适当 的 位 置 上 。 调 用 程序 重新 恢复 执行 的 位 置 是 当 执 行 Call 指令 时 被 修改 的 程序 
计数 器 ( PC ) 所 指出 的 位 置 。 因 此 ， 为 了 能 正确 地 返回 到 调用 程序 中 ，Call 指令 必须 保存 PC 
中 的 内 容 。 

这 种 能 够 在 计算 机 中 调用 子 程序 并 从 子 程序 中 返回 的 方法 称 为 子 程序 链接 ( subroutine 
linkage ) 法 。 最 简单 的 子 程序 链接 法 是 将 返回 地 址 存储 在 一 个 指定 的 单元 中 ， 这 个 单元 可 以 是 
一 个 专门 用 于 这 种 功能 的 寄存 器 ， 这 种 寄存 器 被 称 为 链接 寄存 器 (link register )。 当 子 程序 完 
成 了 它 的 任务 时 ，Retur 指令 通过 链接 寄存 器 的 间接 跳 转 返回 到 调用 程序 中 。 

Call 指令 是 一 条 特殊 的 转移 指令 ， 它 执行 以 下 操作 : 

e 将 PC 中 的 内 容 存储 到 链接 寄存 器 中 。 

e 转移 到 由 Call 指令 指定 的 目标 地 址 中 。 

Returm 指令 也 是 一 条 特殊 的 转移 指令 ， 它 执行 的 操作 是 : 

e 转移 到 链接 寄存 器 所 保存 的 地 址 中 。 

图 2-16 说 明了 Call 和 Retum 指令 是 如 何 影响 PC 和 链接 寄存 器 的 。 








存储 单元 。 调用 程序 存储 单元 。 子 程 序 SUB 


一 一 一 





200 Cal SUB “一 一 一 > 1000 第 -条 指令 


204 下 一 条 指令 | . 
: Return 











Call Return 
图 2-16 ”使 用 链接 寄存 器 的 子 程序 链接 
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2.7.1 子 程 序 媒 套 及 处 理 器 堆栈 

一 个 子 程序 调用 另 一 个 子 程序 叫做 子 程序 谈 套 (subroutine nesting )。 在 这 种 情况 下 ， 第 二 
个 调用 的 返回 地 址 也 被 存储 在 链接 寄存 器 中 ， 这 会 覆盖 它 原 有 的 内 容 。 因 此 ， 在 调用 其 他 子 程 
序 之 前 ， 把 链接 寄存 器 中 的 内 容 存 储 到 其 他 的 单元 里 是 十 分 重要 的 ， 否 则 第 一 个 子 程 序 的 返回 
地 址 将 会 丢失 。 

子 程序 的 垦 套 可 以 达到 任何 深度 。 最 终 ， 最 后 一 个 被 调用 的 子 程序 完成 它 的 计算 并 返回 
到 调用 它 的 子 程序 中 。 第 一 次 返回 所 需要 的 返回 地 址 ， 是 能 套 调 用 序列 中 最 后 一 个 生成 的 。 也 
就 是 说 ， 返 回 地 址 的 生成 和 使 用 是 按照 后 进 先 出 的 顺序 进行 的 。 这 意味 着 ， 与 子 程序 调用 有 关 
的 返回 地 址 应 该 被 压 人 处 理 器 栈 中 。 

如 果 一 个 给 定 的 子 程序 SUB1 在 调用 另 一 个 子 程序 SUB2 之 前 ， 把 返回 地 址 保存 到 栈 中 的 
链接 寄存 器 中 ( 该 链接 寄存 器 是 通过 栈 指针 SP 访问 的 )， 那 么 就 可 以 实现 正确 的 拉 套 调用 顺 
序 。 然 后 ， 在 执行 它 自己 的 Return 指令 之 前 ， 子 程序 SUB1 必须 从 栈 中 弹出 所 保存 的 返回 地 
址 ， 并 将 其 装 入 链接 寄存 器 中 。 


2.7.2 ”参数 传递 

当 调 用 一 个 子 程序 时 ， 程 序 必须 要 给 子 程 序 提供 参数 ， 也 就 是 那些 将 在 计算 中 使 用 的 操 
作 数 或 是 它们 的 地 址 。 然 后 ， 子 程序 返回 另外 的 一 些 参 数 ， 通 常 是 计算 的 结果 。 这 种 在 调用 
程序 和 子 程序 之 间 的 信息 交换 称 为 参数 传递 ( parameter passing )。 人 参数 传递 能 够 用 多 种 方法 实 
现 。 参 数 可 以 放 在 寄存 器 或 存储 单元 中 ， 这 些 地 方 是 能 够 被 子 程序 访问 到 的 。 或 者 ， 可 以 将 这 
些 参数 放 在 处 理 器 栈 中 。 

通过 处 理 器 寄存 器 进行 参数 传递 是 简单 有 效 的 。 图 2-17 给 出 了 图 2-8 中 将 一 列 数字 相 加 
的 程序 是 如 何 作 为 一 个 子 程序 (LISTADD )， 通 过 寄存 器 传递 参数 来 实现 的 。 存 储 在 存储 单元 


Load R2,N 参数 1 为 列表 长 度 
Move R4, #NUMI 参数 2 为 列表 位 置 
Call LISTADD 调用 子 程序 

Store R3, SUM 保存 结果 


子 程序 


LISTADD: Subtract SP SP #4 
Store R5, (SP) 将 Rs 的 内 容 保 存 到 栈 中 
Clear R3 将 和 初始 化 为 0 
LOOP: Load R5, (R4) 获取 下 一 个 数 
Add R3, R3, R5 把 这 个 数 加 到 和 中 
Add R4, R4, #4 将 指针 增加 4 
Subtract R2, R2, #1 递减 计数 器 
Branch_if_[R2]>0 LOOP 
Load R5, (SP) 穴 
Add SP SP #4 RE 


Remm 返回 到 调用 程序 





图 2-17 将 图 2-8 中 的 程序 写成 一 个 子 程序 ; 通过 寄存 器 传递 参数 
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N 中 的 列表 大 小 n 和 第 一 个 数 的 地 址 NUMI1 分 别 通过 寄存 器 R2 和 R4 传递 。 由 子 程序 计算 出 
来 的 和 通过 寄存 器 R3 传 回 给 调用 程序 。 在 图 2-17 中 ， 前 四 条 指令 组 成 了 调用 程序 的 相关 部 
分 。 其 中 的 前 两 条 指令 把 n 和 NUMI1 分 别 装 入 R2 和 R4 中 。Call 指令 转移 到 子 程序 的 起 始 位 
置 LISTADD 处 ， 并 将 返回 地 址 ( 即 这 个 调用 程序 的 Store 指令 的 地 址 ) 保存 到 链接 寄存 器 中 。 
子 程序 计算 出 和 并 将 它 放 入 R3 中 。 子 程序 执行 Return 指令 后 ， 调 用 程序 将 R3 中 的 和 存储 到 
存储 单元 SUM 中 。 

除了 用 来 传递 参数 的 寄存 器 R2、R3 和 R4 外 ， 子 程序 还 用 到 了 寄存 器 R5。 由 于 调用 程序 
可 能 也 用 到 了 R5， 所 以 需要 在 子 程序 的 入 口 处 将 它 的 值 也 压 人 处 理 器 栈 中 保存 起 来 ， 并 在 返 
回调 用 程序 前 恢复 。 

如 果 涉 及 许多 参数 ， 那 么 可 用 的 通用 寄存 器 就 有 可 能 不 能 满足 向 子 程序 传递 参数 的 需要 。 
处 理 器 栈 提 供 了 一 种 方便 灵活 的 机 制 来 传递 任意 数量 的 参数 。 图 2-18 给 出 了 由 图 2-8 的 程序 
重 写成 的 子 程序 LISTADD， 这 个 子 程序 用 处 理 器 栈 传递 参数 。 该 列表 中 第 一 个 数 的 地 址 以 及 
列表 中 的 项 数 被 压 人 由 寄存 器 SP 指向 的 处 理 器 栈 中 。 然 后 子 程序 被 调用 。 在 返回 调用 程序 之 
前 ， 计 算出 的 和 被 放 到 栈 中 。 


假设 栈 顶 在 图 2-19 的 第 一 级 中 
Move R2, #NUMI 把 参数 压 人 栈 中 
Subtract SP, SP #4 
Store R2, (SP) 
Load R2,N 
Subtract SP, SP #4 
Store R2, (SP) 
Call LISTADD 调用 子 程序 ( 栈 顶 
在 第 二 级 ) 
Load R2, 4(SP) 从 栈 中 获取 结果 并 
Store R2, SUM 保存 到 SUM 中 
Add SP SP #8 恢复 栈 顶 ( 栈 顶 在 
第 一 级 ) 


LISTADD: Subtract SP, SP, #16 保存 寄存 器 
Store R2, 12(SP) 
Store R3, 8(SP) 


Store R4, 4(SP) 

Store R5, (SP) ( 栈 顶 在 第 三 级 ) 
Load R2, 16(SP) 将 计数 器 初始 化 为 n 
Load R4, 20(SP) 初始 化 指针 使 其 指向 列表 
Clear R3 将 和 初始 化 为 0 
Load R5, (R4) 获取 下 一 个 数 

Add R3, R3, R5 把 这 个 数 加 到 和 中 
Add R4, R4, #4 将 指针 增加 4 
Subtract R2, R2, #1 递减 计数 器 
Branch_if [R2]>0 LOOP 

Store R3, 20(SP) 把 结果 放 到 栈 中 
Load RS, (SP) 恢复 寄存 器 

Load R4, 4(SP) 

Load R3, 8(SP) 

Load R2, 12(SP) 

Add SP, SP, #16 ( 栈 顶 在 第 二 级 ) 
Return 返回 到 调用 程序 


图 2-18 将 图 2-8 中 的 程序 写成 一 个 子 程序 ; 在 堆栈 上 传递 参数 
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图 2-19 展示 了 这 个 例子 中 栈 的 表 项 。 假 设 在 子 程序 被 调用 之 前 ， 栈 顶 在 第 一 级 上 。 调 用 
程序 将 地 址 NUM1 和 数值 n 压 入 栈 中 ， 并 调用 子 
程序 LISTADD。 现 在 栈 顶 是 在 第 二 级 上 。 子 程序 
在 运行 的 时 候 使 用 了 四 个 寄存 器 ， 因 为 这 些 寄存 器 
中 可 能 包含 属于 调用 程序 的 有 效 数 据 ， 所 以 在 子 程 
序 开 始 的 时 候 ， 它 们 的 内 容 应 该 被 压 人 栈 中 进行 保 
存 。 现 在 栈 顶 是 在 第 三 级 上 。 子 程序 使 用 变 址 寻 址 
方式 从 这 个 堆栈 里 访问 参数 上 和 NUM1， 其 中 偏 移 
量 的 值 是 相对 于 新 的 栈 顶 (第 三 级 ) 而 言 的 。 注 意 
这 一 操作 不 改变 栈 指针 ， 因 为 有 效 的 数据 项 仍然 是 
在 这 个 栈 的 栈 项 。 数 值 n 被 装 人 R2 中 作为 计数 的 
初始 值 ， 并 且 地 址 NUMI1 被 装 入 R4 中 作为 扫描 这 
个 列表 表 项 的 一 个 指针 。 

在 计算 结束 时 ， 寄 存 器 R3 中 包含 着 计算 出 来 加 2.19 国生 骨 各 序 下 梳 的 内 谷 
的 和 。 在 子 程序 返回 到 调用 程序 之 前 ，R3 的 内 容 被 插入 到 这 个 栈 中 ， 替 换 了 参数 NUM1 ， 因 
为 这 个 参数 不 再 需要 了 。 然 后 子 程序 所 使 用 的 这 四 个 寄存 器 的 内 容 从 栈 中 恢复 。 同 样 ， 增 加 栈 
指针 以 指向 子 程序 被 调用 时 已 存在 的 栈 顶 ， 即 第 二 级 中 的 参数 n。 子 程序 返回 后 ， 调 用 程序 将 
结果 存在 单元 SUM 中 ， 再 通过 将 SP 增加 8 的 方式 来 将 栈 顶 降 到 它 原来 的 级 别 上 。 

观察 图 2-18 中 的 子 程序 LISTADD 可 以 发 现 ， 我 们 没有 使 用 这 对 指令 

Subtract SP, SP, #4 

Store Rj, (SP) 
去 把 每 个 寄存 器 的 内 容 压 到 栈 中 。 由 于 我 们 必须 保存 四 个 寄存 器 ， 所 以 需要 八条 指令 。 而 通 
过 立即 调整 SP 使 其 指向 四 个 寄存 器 都 保存 后 即 生效 的 栈 顶 ， 我 们 则 只 需要 五 条 指令 。 然 后 ， 
用 变 址 方式 来 保存 寄存 器 的 内 容 。 在 从 子 程序 返回 前 恢复 寄存 器 的 时 候 ， 我 们 使 用 同样 的 优 
化 方式 。 

我 们 还 应 该 注意 到 一 些 计算 机 有 特殊 的 指令 用 于 装载 和 保存 多 个 寄存 器 。 例 如 ， 可 以 使 

用 如 下 指令 将 图 2-18 中 的 四 个 寄存 器 保存 在 栈 中 : 
StoreMultiple  R2-R5, —(SP) 
源 寄 存 器 通过 范围 R2-R5 说 明 。 记 号 -(SP) 说 明了 栈 指针 必须 相应 地 调整 。 前 面 的 减 号 表明 
在 把 每 个 寄存 器 的 内 容 放 到 栈 中 之 前 ， 必 须 将 SP 减 4。 
同样 ， 指 令 





LoadMultiple R2-RS, (SP)+ 

以 相反 的 顺序 将 保存 在 栈 中 的 值 加 载 到 寄存 器 R2、R3、R4 和 R5 中 。 记 号 (SP)+ 表明 在 将 
每 个 值 装 人 相应 的 寄存 器 之 后 ， 必 须 将 栈 指针 增加 4。 我 们 将 在 2.9.1 节 中 详细 讨论 -(SP) 和 
(SP)+ 所 表示 的 寻 址 方式 。 

按 值 和 按 引 用 的 参数 传递 

注意 在 图 2-17 和 图 2-18 中 两 个 参数 NUMI1 入 的 实际 值 被 传递 到 了 子 程序 中 ， 子 程 
序 的 目的 是 对 一 个 列表 中 的 数字 做 加 法 。 调 用 程序 不 传递 实际 的 列表 项 ， 而 传递 这 个 列表 中 
第 一 个 数 的 地 址 ， 这 种 技术 叫做 按 引用 传递 (passing by reference )。 第 二 个 参数 是 按 值 传递 
( passing by value )， 也 就 是 将 实际 的 表 项 数 n 传递 到 子 程序 中 。 
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2.7.3 ”堆栈 的 结构 
现在 我 们 来 看 在 图 2-18 和 2-19 的 例子 中 存储 空间 是 如 何 作为 栈 来 使 用 的 。 在 子 程序 执行 
期 间 ， 栈 顶 的 6 个 单元 包含 了 子 程序 需要 的 条 目 。 这 些 单元 构成 了 子 程序 的 一 个 私有 工作 空 
间 ， 该 空间 在 进入 子 程序 时 分 配 ， 当 子 程序 将 控制 交 回调 用 程序 时 释放 。 这 种 空间 叫做 栈 结构 
( stack frame )。 如 果子 程序 需要 更 多 的 空间 用 于 存储 局 部 变量 ， 也 可 以 在 栈 中 为 这 些 变量 分 配 
空间 。 
图 2-20 给 出 了 一 个 常用 的 栈 结构 中 的 信息 布局 示例 。 除 了 栈 指针 SP 外 ， 通 常 还 需要 另 一 
个 指针 寄存 器 : 结构 指针 (frame pointer，FP )， 以 便于 访问 传递 到 子 程序 中 的 参数 ， 以 及 子 程 
序 中 使 用 的 局 部 变量 。 在 该 图 中 ， 我 们 假设 有 四 个 参数 被 传递 到 子 程序 中 ， 有 三 个 局 部 变量 要 
在 子 程序 内 部 使 用 ， 还 有 寄存 器 R2、R3 和 R4 需要 进行 保存 ， 因 为 它们 也 要 在 子 程序 中 使 用 。 
就 像 我 们 会 在 下 面 的 例子 中 看 到 的 一 样 ， 当 使 用 财 套 子 程序 的 时 候 ， 调 用 程序 的 栈 结构 还 将 包 
括 返回 地 址 。 
如 图 2-20 所 示 , FP 寄存 sp _. 
器 指向 所 存储 参数 正 上 方 的 栈 指 针 
单元 ,我 们 可 以 使 用 变 址 寻 
址 方式 很 容易 地 访问 这 些 参 
数 和 局 部 变量 。 参 数 可 以 用 
地 址 4(FP)、8(FP)、… 访 问 。 
局 部 变量 可 以 用 地 址 -4(FP)、 
一 8(FP)、… 访 问 ，FP 中 的 内 EE 
容 在 子 程序 执行 期 间 保持 不 ”结构 指针 “一 
变 ， 这 一 点 不 同 于 栈 指针 
SP，SP 必须 始终 指向 栈 中 当 
前 的 栈 项 元 素 。 
现在 我 们 来 看 看 当 调 用 
一 个 子 程序 ， 对 它 的 栈 结构 
进行 分 配 、 使 用 和 释放 时 ， 
指针 SP 和 FP 是 如 何 操作 
的 。 我 们 首先 假定 SP 指向 
图 2-20 中 原来 的 栈 顶 图 2-20 一 个 子 程序 栈 结构 示例 
( TOS ) 元 素 ， 在 子 程序 被 调用 之 前 ， 调 用 程序 将 四 个 参数 压 和 人 栈 中 。 然 后 执行 Call 指令 。 这 
时 ，SP 指向 最 后 一 个 被 压 人 栈 中 的 参数 。 如 果子 程序 要 使 用 结构 指针 ， 它 应 该 先 把 FP 的 内 容 
压 人 栈 中 保存 起 来 ， 因 为 FP 通常 是 一 个 通用 寄存 器 ， 它 可 能 包含 用 于 调用 程序 的 信息 。 此 
时 ，SP 指向 保存 着 FP 值 的 单元 。 然 后 将 SP 的 值 拷贝 到 FP 中 。 
这 样 一 来 ， 在 子 程序 中 执行 的 前 三 条 指令 是 : 






Subtract SP, SP, #4 
Store FP, (SP) 
Move FP, SP 


Move 指令 将 SP 的 值 复制 到 FP 中 。 这 些 指令 执行 以 后 ，SP 和 FP 都 指向 了 保存 后 的 FP 的 内 
容 。 现 在 通过 执行 以 下 指令 在 栈 中 为 三 个 局 部 变量 分 配 空间 : 
Subtract SP, SP, #12 
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最 后 ， 处 理 器 寄存 器 R2、R3 和 R4 的 内 容 被 压 人 栈 中 进行 保存 。 此 时 ， 这 个 栈 结构 已 经 被 设 


置 成 如 图 2-20 所 示 的 状况 。 

子 程序 现在 开始 执行 它 的 任 
务 。 当 这 个 任务 完成 时 ， 子 程序 
弹出 R4、R3 和 R2 的 保存 值 放 
回 到 这 些 寄存 器 中 ， 执 行 以 下 指 
令 从 栈 结构 中 释放 局 部 变量 : 

Add SP, SP,#12 
并 且 弹 出 所 保存 的 FP 旧 值 放 回 
到 FP 中 。 这 时 候 ，SP 指向 了 放 
在 栈 中 的 最 后 一 个 参数 ， 接 着 执 
行 返回 指令 Retum， 将 控制 交还 
给 调用 程序 。 

调用 程序 负责 从 栈 结构 中 释 
放 这 些 参数 ， 其 中 一 些 可 能 是 子 
程序 传递 回来 的 结果 。 在 释放 参 
数 之 后 ， 栈 指针 指向 原来 的 TOS 
( 栈 项 )， 于 是 我 们 又 回 到 了 调用 
前 的 状态 。 

用 于 子 程 序 栓 套 的 栈 结构 

当 使 用 艇 套子 程序 的 时 候 ， 
需要 保证 返回 地 址 都 被 正确 地 保 
存 起 来 。 当 调用 程序 调用 一 个 子 
程序 SUB1 的 时 候 ， 返 回 地 址 被 
保存 在 链接 寄存 器 中 。 现 在 ， 如 
果 SUB1 要 调用 另 一 个 子 程 序 
SUB2， 它 必须 在 调用 SUB2 之 
前 保存 链接 寄存 器 的 当前 内 容 。 
保存 返回 地 址 的 合适 位 置 是 在 
SUB1 的 栈 结构 中 。 如 果 SUB2 
接着 又 调用 SUB3， 那 么 它 必须 
将 链接 寄存 器 的 当前 内 容 保存 到 
与 SUB2 相关 联 的 栈 结构 中 ， 以 
此 类 推 。 

我 们 来 看 一 个 例子 ， 主 程序 
调用 了 第 一 个 子 程序 SUB1， 然 
后 SUB1 又 调用 了 第 二 个 子 程序 
SUB2， 该 过 程 由 图 2-21 给 出 。 
这 两 个 能 套子 程序 所 对 应 的 栈 结 
构 如 图 2-22 所 示 。 所 有 与 这 个 
例子 相关 的 参数 都 被 传递 到 栈 


主 程序 


2000 
2004 
2008 
2012 
2016 
2020 
2024 
2028 
2032 
2036 
2040 


第 一 个 子 程 序 
2100 SUB1: 
2104 
2108 
2112 
2116 
2120 
2124 
2128 
2132 
2136 


第 二 个 子 程序 


3000 SUB2: 
3004 


Load 


Subtract 


Store 
Load 


Subtract 


Store 
Call 
Load 
Store 
Add 


R2, PARAM2 
SP, SP,#4 
R2, (SP) 

R2, PARAMI 
SP, SP #4 
R2, (SP) 
SUB1 

R2, (SP) 

R2, RESULT 
SP SP #8 


下 一 条 指令 


Subtract SP, SP #24 


Store 
Store 
Store 
Store 
Store 
Store 
Add 

Load 
Load 


Load 


Subtract 


Store 
Call 
Load 
Add 


Store 
Load 
Load 
Load 
Load 
Load 
Load 
Add 
Retum 


LINK_reg,20(SP) 
FP, 16(SP) 

R2, 12(SP) 

R3, 8(SP) 

R4, 4(SP) 

R5, (SP) 

FP, SP #16 

R2, 8(FP) 

R3, 12(FP) 


R4, PARAM3 
SP SP #44 
R4, (SP) 
SUB2 

R4, (SP) 

SP, SP #4 


RS5, 8(FP) 

RS, (SP) 

R4, 4(SP) 

R3, 8(SP) 

R2, 12(SP) 

FP, 16(SP) 
LINK_reg, 20(SP) 
SP, SP #24 


SP SP, #12 
FP, 8(SP) 
R2, 4(SP) 
R3, (SP) 
FP SP #8 
R2, 4(FP) 


R3, 4(FP) 
R3, (SP) 
R2, 4(SP) 
FP, 8(SP) 
SP SP #12 


图 2-21 


将 参数 放置 到 栈 中 


调用 子 程序 
保存 结果 


恢复 栈 的 级 数 


保存 寄存 器 


初始 化 结构 指针 
获取 第 一 个 参数 
获取 第 二 个 参数 


将 参数 放置 到 栈 中 


从 SUB2 获 取 结 果 


将 答案 放 入 栈 中 
恢复 寄存 器 


返回 到 主 程序 


保存 寄存 器 
初始 化 结构 指针 
获取 参数 


将 SUB2 的 结果 放 入 栈 中 
恢复 寄存 器 





返回 到 子 程序 1 


嵌 套 子 程序 
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中 ， 这 两 个 图 中 只 显示 了 在 主 程序 和 两 个 子 程序 中 的 控制 流 和 数据 。 实 际 的 计算 方法 并 没有 


















给 出 。 
执行 的 流程 如 下 : 主 程序 将 两 个 参数 ea 
param2 和 paraml 按 顺序 压 进 栈 中 ， 然 后 
调用 SUB1。 第 一 个 子 程序 负责 计算 一 个 结 
果 并 使 用 栈 将 这 个 结果 传 回 给 主 程序 。 在 二 SUB2 的 栈 结 构 
其 计算 过 程 中 ，SUB1 调用 了 第 二 个 子 程序 
SUB2， 用 于 执行 一 些 其 他 的 子 任务 。SUBI 
给 SUB2 传 递 了 一 个 单独 的 参数 param3， 
并 且 通 过 栈 中 相同 的 位 置 把 结果 传 回 给 
SUB1。 当 SUB2 执行 了 Retum 指令 以 后 ， 
SUB1 把 这 个 结果 装 人 寄存 器 R4 中 。 然 后 a 
SUB1 继续 计算 ， 最 后 用 堆栈 方式 将 所 需要 ”下 一 ~ 
的 答案 传 回 给 主 程序 。 当 SUB1 执行 返回 指 
令 返 回 到 主 程序 时 ， 主 程序 将 这 个 答案 存 
放 在 存储 单元 RESULT 中 ， 恢 复 栈 的 级 数 ， 
然后 在 地 址 为 2040 的 下 一 条 指令 处 继续 它 | 原来 的 TOS 


的 计算 过 程 。 要 注意 返回 到 调用 程序 的 地 址 
2028 是 如 何 存储 到 图 2-22 中 SUB1 的 栈 结 
构 中 的 。 

在 图 2-21 中 的 注释 给 出 了 如 何 管理 这 个 执行 流程 的 细节 。 每 个 子 程序 执行 的 第 一 个 动作 
是 将 所 有 在 子 程序 中 用 到 的 寄存 器 的 内 容 保存 到 栈 中 ,包括 结构 指针 和 链接 寄存 器 ( 如 果 需 要 
的 话 )。 接 着 初始 化 结构 指针 。SUB1 使 用 了 R2 到 R5 四 个 寄存 器 ， 而 SUB2 使 用 了 R2 和 R3 
两 个 寄存 器 。 这 些 寄 存 器 、 结 构 指 针 和 SUB1 用 到 的 链接 寄存 器 只 有 在 执行 Retum 指令 之 前 
才 会 被 恢复 。 

使 用 与 结构 指针 寄存 器 FP 有 关 的 变 址 寻 址 方式 ， 可 以 从 栈 中 加 载 参数 以 及 将 答案 放 回 到 
栈 中 。 这 些 操作 中 使 用 的 字 节 偏 移 量 通常 是 4、8、…， 如 同 在 图 2-20 中 讨论 的 一 般 栈 结构 一 
样 。 最 后 要 注意 的 是 ， 每 个 调用 程序 要 负责 从 栈 中 删除 自己 的 参数 。 这 是 由 Add 指令 来 完成 
的 ，Add 指令 可 以 降低 栈 顶 。 


2.8 其 他 指令 


到 目前 为 止 ， 我 们 已 经 介绍 了 下 列 指 令 : Load、Store、Move、Clear、Add、Subtract、 
Branch 、Call 和 Return。 使 用 这 些 指令 和 表 2-1 中 的 寻 址 方式 ， 我 们 已 经 可 以 编写 程序 来 说 明 
机 器 指令 的 执行 序列 了 ， 包 括 转移 和 子 程序 的 链接 。 在 这 一 节 中 ， 我们 再 介绍 几 条 指令 ， 这 些 
指令 是 在 大 部 分 指令 集中 都 存在 的 。 


2.8.1 逻辑 指令 
按 位 AND (与 )、OR (或 ) 和 NOT ( 非 ) 等 逻辑 操作 ， 是 数字 电路 的 基本 构件 ， 附 录 A 
中 对 数字 电路 进行 了 介绍 。 逻 辑 操作 也 可 以 在 软件 中 执行 ， 用 一 些 指令 将 这 些 操作 独立 或 是 并 
行 地 施加 于 一 个 字 或 一 个 字 节 的 所 有 位 上 。 例 如 ， 指 令 
And R4,R2,R3 


图 2-22 图 2-21 的 栈 结构 
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对 寄存 器 R2 和 R3 中 的 操作 数 进行 按 位 AND (与 ) 运算 ， 并 且 将 结果 存在 R4 中 。 这 条 指令 
的 立即 数 形式 可 能 是 : 

And R4,R2,#Value 
在 这 里 Value 本 来 是 一 个 16 位 的 逻辑 值 ， 通 过 向 其 16 个 最 高 有 效 位 填充 0 来 将 其 扩展 到 
32 位 。 

下 面 考虑 这 条 逻辑 指令 的 应 用 。 假 设 有 四 个 ASCII 字符 被 保存 在 32 位 的 寄存 器 R2 
中 。 在 某 个 任务 中 ， 我 们 希望 确定 最 右边 的 字符 是 否 为 Z， 如 果 是 Z， 就 执行 条 件 转移 到 
FOUNDZ。 从 第 1 章 的 表 1-1 中 我 们 找到 了 字符 Z 的 ASCI 码 是 01011010， 用 十 六 进 制 记 数 
法 表示 为 SA。 这 三 条 指令 的 序列 

And R2, R2, #OxFF 

Move R3, #0x5A 

Branch if [R2]=[R3] FOUNDZ 
实现 了 所 期 望 的 动作 。And 指令 将 R2 中 最 左边 三 个 字符 的 所 有 位 都 清 0， 而 使 最 右边 的 字符 
保持 不 变 。 这 是 由 于 使 用 了 一 个 右 端 8 位 是 1， 左 端 24 位 是 0 的 立即 操作 数 。Move 指令 将 
十 六 进 制 值 SA 加 载 到 R3 中 。 由 于 R2 和 R3 最 左边 的 24 位 都 为 0， 所 以 Branch 指令 将 R2 中 
右 端 的 剩余 字符 与 字符 Z 的 二 进 制 表示 形式 进行 比较 ， 如 果 相 匹配 ， 就 产生 一 个 到 FOUNDZ 
的 跳 转 。 


2.8.2” 移 位 和 循环 移 位 指令 

有 很 多 应 用 需要 将 一 个 操作 数 的 位 向 右 或 向 左 移动 指定 数量 的 位 。 这 个 移动 过 程 如 何 被 
执行 ， 取决 于 操作 数 是 一 个 有 符号 数 还 是 一 般 的 二 进 制 码 信 息 。 对 于 一 般 的 操作 数 ， 我 们 使 用 
逻辑 移 位 。 对 于 有 符号 数 ， 我 们 使 用 算术 移 位 ， 算 术 移 位 可 以 保持 该 数 的 符号 不 变 。 

1 逻辑 移 位 

有 两 条 逻辑 移 位 指令 ， 一 条 是 左 移 (LShiftL )， 另 一 条 是 右 移 (LShiftR )。 这 些 指 令 将 一 
个 操作 数 移动 一 定数 量 的 位 ， 这 个 移动 数量 值 由 该 指令 中 的 一 个 计数 操作 数 指定 。 人 逻辑 左 移 指 
令 的 一 般 形式 为 : 

LShiftL Ri, Ry, count 

该 指令 将 寄存 器 Rj 的 内 容 左 移 计 数 操作 数 所 给 定 的 位 数 ， 并 把 结果 放 到 寄存 器 Ri 中， 而 Rj 
的 内 容 没 有 改变 。 计 数 操作 数 可 以 作为 一 个 立即 操作 数 给 出 ， 也 可 以 包含 在 一 个 处 理 器 寄存 器 
中 。 为 了 完善 左 移 操作 的 描述 ， 我 们 需要 指明 目的 操作 数 右边 空 出 位 的 值 ， 并 确定 在 左 端 移出 
的 位 上 发 生 了 什么 。 空 出 的 位 置 用 0 填充 。 在 不 使 用 条 件 码 标志 的 计算 机 中 ， 移 出 的 位 被 简单 
地 丢弃 。 在 使 用 条 件 码 标志 的 计算 机 中 (将 在 2.10.2 节 中 讨论 )， 这 些 位 经 过 进位 标志 C， 然 
后 再 被 丢弃 。 将 C 标志 一 起 参与 移 位 ， 这 在 对 占用 多 个 字 的 大 数 执行 算术 运算 的 时 候 是 很 有 
用 的 。 图 2-23a 给 出 了 一 个 例子 ， 它 将 寄存 器 R3 的 内 容 左 移 两 位 。 逻 辑 右 移 指令 LShiftR 除 
了 向 右 移 以 外 ， 其 他 工作 方式 与 逻辑 左 移 指令 是 相同 的 。 图 2-23b 说 明了 这 种 操作 。 

2， 数字 打包 示例 

考虑 以 下 的 小 任务 ， 它 说 明了 移 位 操作 和 逻辑 操作 的 用 法 。 假 设 两 个 ASCII 码 表示 的 十 
进 制 数 存储 在 存储 器 的 字 节 单元 LOC 和 LOC+1 中 。 我 们 希望 将 这 些 十 进 制 数 用 4 位 BCD 码 
表示 ， 并 将 两 个 数 的 BCD 码 都 存放 到 一 个 单独 的 字 节 单元 PACKED 中 。 上 述 的 结果 被 称 为 是 
打包 BCD 码 (packed-BCD ) 格式 的 。 第 1 章 的 表 1-1 给 出 了 对 应 于 十 进 制 数 BCD 码 的 ASCII 
码 最 右边 的 四 位 数 。 因 此 ， 我 们 需要 做 的 就 是 在 LOC 和 LOC+1 中 提取 出 低 4 位 的 内 容 ， 然 后 


[168 





将 它们 拼接 成 一 个 单字 节 放 在 PACKED 中 。 
图 2-24 所 示 的 指令 序列 
帝 成 这 本 样 务 ， 它 用 窒 着 里 -一 [cj 0 
R2 作为 指向 存储 器 中 ASCII 
码 字 符 的 指针 ， 并 用 寄存 器 之 前 [9] 
R3 和 R4 来 生成 BCD 数字 码 。 
程序 使 用 LoadByte 指令 ， 从 ”之 后 加 
存储 器 中 加 载 一 个 字 节 到 32 


00 


位 处 理 器 寄存 器 最 右边 的 8 a ) 逻辑 左 移 LShiftL R3, R3,#2 
位 ， 并 将 剩 下 的 高 位 清 为 0。 
StoreByte 指令 将 源 寄 存 器 中 0 3 


最 右边 的 字 节 写 人 到 指定 的 目 


的 音 元 中 ， 但 是 不 影响 其 他 的 之 省 
1 1 0 * .0 


字 节 单元 。And 指令 中 的 值 


0xF 用 于 将 R4 中 除 最 右边 四 之 后 L0001 
位 以 外 的 其 他 所 有 位 清 0。 注 
意 ， 立 即 源 操作 数 被 写成 b ) 逻辑 右 移 LShiftR  R3, R3, #2 


0xF， 将 它 被 解释 为 一 个 32 位 


的 模式 ， 其 最 高 有 效 位 上 有 | 

28 个 0。 
3， 算 术 移 位 
在 算术 移 位 中 ， 将 被 移 之 前 |100113 0f0 [oj 


位 的 位 模式 解释 成 一 个 有 符号 
数 。 图 1-3 中 补 码 的 二 进 制 数 之 后 ] 
表示 法 表明 将 一 个 数 向 左 移动 





一 位 就 相当 于 将 这 个 数 乘 以 c ) 算术 右 移 AShiftR CR3, R3, #2 

2 ;而 向 右 移 动 一 位 相当 于 将 图 2-23 逻辑 和 算术 移 位 指令 
这 个 数 除 以 2。 当然 ， 在 左 移 i ey 

时 可 能 会 产生 溢出 ， 而 右 移 时 R3, (R2) 将 第 一 个 字 节 加 载 到 R3 中 
余数 可 能 会 被 丢失 。 另 一 个 要 A Re 

注意 的 是 ， 由 于 数 的 补 码 表示 R4, (R2) 将 第 二 个 字 节 加 载 到 R4 中 
法 的 要 求 ， 在 右 移 中 必须 在 空 Re 

位 上 重 写 符号 位 进行 填充 。 在 R3, PACKED 保存 结果 

右 移 时 这 种 要 求 将 算术 移 位 与 

逻辑 移 位 区 别 开 来 ， 在 逻辑 移 图 2-24 一 个 将 两 个 BCD 数 打包 到 一 个 字 节 中 的 程序 


位 中 总 是 用 0 对 空位 进行 填充 。 没 有 这 种 要 求 的 话 ， 这 两 种 移 位 是 一 样 的 。 在 图 2-23c 中 给 出 
了 算术 右 移 指令 AShiftR 的 一 个 例子 ,算术 左 移 与 逻辑 左 移 是 完全 相同 的 。 

4. 循环 移 位 操作 

在 移 位 操作 中 ， 除 了 最 后 一 个 移出 位 保存 在 进位 标志 C 中 以 外 ， 操 作 数 的 其 他 移出 位 都 
被 丢掉 了 。 针 对 希望 保留 所 有 位 的 情况 ， 可 以 使 用 循环 移 位 指令 。 这 些 指令 将 操作 数 一 端 移出 
的 位 移动 到 操作 数 的 另 一 端 。 通 常 循 环 左 移 和 循环 右 移 都 有 两 种 版 本 的 指令 。 在 一 种 版 本 里 ， 
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操作 数 的 位 被 简单 地 进行 循环 。 在 另 一 种 版 本 里 ， 循 环 中 包括 了 C 标志 。 图 2-25 给 出 了 在 循 
环 中 包含 或 不 包含 C 标志 的 循环 左 移 和 循环 右 移 操作 。 要 注意 的 是 ， 当 循环 中 不 包括 C 标志 
时 ，C 标志 中 仍然 保留 着 寄存 器 尾部 的 最 后 一 个 移出 位 。OP 码 RotateL 、RotateLC 、RotateR 
和 RotateRC 表示 执行 循环 移 位 操作 的 指令 。 


Ep | 


之 前 [o] 全 工 症 0 0 11 之 前 [oj 01110 0 1 1 
#8 @ x# 回 [TE 
a ) 不 带 进位 的 循环 左 移 RotateL R3, R3, #2 b ) 带 进位 的 循环 左 移 RotateLC R3, R3, #2 


a Rs SS 


之 前 回  z 前 [Co] 

zi 加 zx 口 

c ) 不 带 进位 的 循环 右 移 RotateR R3, R3, #2 d) 带 进位 的 循环 右 移 RotateRC R3, R3, #2 
图 2-25 循环 移 位 指令 


2.8.3 ”乘法 和 除法 
与 我 们 之 前 看 到 过 的 Add 指令 的 格式 一 样 ， 两 个 有 符号 整数 可 以 用 机 器 指令 进行 乘 和 除 。 
指令 
Multiply Rk, Ri, Ry 
执行 的 操作 为 : 
Rk < [Ri] x [了 
两 个 位 数 的 乘积 可 以 是 22 位 大 的 数 。 因 此 ， 乘 积 肯定 不 能 放 进 寄存 器 Rk 中 。 许 多 指令 集 
中 都 有 一 条 乘法 (Multiply ) 指令 ， 它 计算 乘积 的 低 n 位 并 把 它 放 在 寄存 器 Rk 中 ， 就 像 说 明 
的 那样 。 如 果 已 知 在 一 些 特殊 的 应 用 任务 中 所 有 乘积 都 将 是 不 超过 位 的 数 ， 这 是 足够 的 。 为 
了 适应 一 般 的 2n 位 乘积 的 情况 ， 一 些 处 理 器 将 乘积 生成 在 两 个 寄存 器 中 ， 通 常 是 相 邻 的 寄存 
器 Rk 和 R(k+1)， 其 中 高 位 部 分 放 在 寄存 器 R(k+1) 中 。 
一 个 指令 集 还 可 以 提供 一 条 有 符号 整数 的 除法 ( Divide ) 指令 
Divide Rk, Ri,Ry 
它 执 行 的 操作 是 : 
Rk < [Rj] / [BR 
把 得 到 的 商 放 到 Rk 中 。 余 数 可 以 放 在 R(k+1) 中 ,或 者 可 以 丢掉 。 
对 于 没有 乘法 ( Multiply ) 和 除法 ( Divide ) 指令 的 计算 机 ， 可 以 用 一 些 基 本 的 指令 序列 
比如 加 ( Add )、 减 (Subtract )、 移 位 ( Shift ) 和 循环 移 位 ( Rotate ) 来 完成 乘除 操作 以 及 其 他 
的 算术 操作 。 当 我 们 在 第 9 章 中 描述 算术 运算 的 实现 时 ， 这 些 将 会 变 得 更 清楚 。 


2.9 处 理 32 位 的 立即 值 
在 2.4.1 节 对 寻 址 方式 的 讨论 中 ,我 们 提出 了 一 个 问题 ， 即 一 个 代表 常数 或 存储 器 地 址 的 
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32 位 值 是 如 何 被 装 人 处 理 器 寄存 器 中 的 。RISC 风格 处 理 器 中 的 立即 寻 址 和 绝对 寻 址 方式 将 操 
作 数 的 大 小 限制 为 16 位。 因此， 一 个 32 位 的 值 不 能 在 单条 指令 中 明确 地 给 出 ， 因 为 单条 指令 
必须 要 放 人 一 个 32 位 的 字 中 。 
为 了 这 个 目的 ， 一 种 可 能 的 解决 办 法 是 用 两 条 指令 。RISC 风格 的 处 理 器 中 有 一 种 方法 是 
使 用 两 种 不 同 的 逻辑 或 ( OR ) 操作 指令 。 指 令 
Or Rdst, Rsrc, #Value 
向 16 位 立即 操作 数 的 高 位 补 0 使 其 扩展 成 32 位 数 ， 然 后 将 其 与 寄存 器 Rsrc 中 的 内 容 进 行 或 
( OR ) 操作 。 如 果 Rsrc 的 值 是 0， 那 么 Rdst 就 正好 是 那个 扩展 的 32 位 数 的 值 。 另 一 条 指令 
OrHigh Rdst, Rsrc, #Value 
将 16 位 的 立即 操作 数 作为 高 位 并 在 低位 补 0 而 形成 一 个 32 位 的 值 。 然 后 该 值 与 Rsrc 的 内 容 
进行 或 ( OR ) 操作 。 通 过 使 用 这 些 指令 ， 并 假设 RO 中 包含 的 值 为 0, 我 们 可 以 按照 下 面 的 方 
式 将 32 位 值 0x20004FF0 装 入 寄存 器 R2 中 : 
OrHigh R2, RO, #0x2000 
Or R2, R2, #0x4FFO 
为 了 更 容易 地 编写 程序 ，RISC 风格 的 指令 集 可 能 包含 伪 指 令 ， 伪 指令 可 以 表示 一 个 需 
要 多 条 机 器 指令 才能 完成 的 动作 。 这 些 伪 指令 会 被 汇编 程序 替换 为 相应 的 机 器 指令 序列 。 例 
如 ， 伪 指令 
MoveImmediateAddress R2,LOC 
可 以 用 于 将 符号 LOC 所 表示 的 32 位 地 址 装 入 寄存 器 R2 中 。 在 汇编 程序 中 ， 它 就 会 被 两 条 使 
用 16 位 值 的 指令 替换 掉 ,， 像 上 面 的 一 样 。 
除了 用 两 条 指令 之 外 还 有 另 一 个 方法 可 以 将 一 个 32 位 的 地 址 加 载 到 寄存 器 中 ， 即 用 多 个 
字 表 示 一 条 指令 。 在 这 种 情况 下 ， 可 以 用 一 条 双 字 指令 在 第 一 个 字 中 给 出 OP 码 和 寄存 器 说 
明 ， 而 在 第 二 个 字 中 含 一 个 32 位 的 值 。 这 种 方法 在 CISC 风格 的 处 理 器 中 使 用 。 
最 后 ， 注 意 到 在 前 面 的 章节 中 我 们 总 是 假设 单条 Load 和 Store 指令 可 以 访问 符号 名 所 代 
表 的 存储 单元 。 这 使 得 示例 程序 更 简单 ， 也 更 容易 阅读 。 如 果 所 需要 的 存储 器 地 址 可 以 用 16 
位 指定 ， 那 么 程序 就 会 正确 地 运行 。 如 果 包 含 更 长 的 地 址 ， 那 么 就 必须 使 用 上 面 描述 的 构建 
32 位 地 址 的 方法 。 


2.10 ”CISC 指令 集 


在 前 面 的 章节 中 ， 我 们 介绍 了 RISC 风格 的 指令 集 。 现 在 我 们 将 研究 复杂 指令 集 计 算 机 
( Complex Instruction Set Computer，CISC ) 的 一 些 重 要 特征 。 

一 个 关键 的 不 同 之 处 是 ，CISC 指令 集 不 受 限于 load/store 体系 结构 (load/store architecture )， 
在 load/store 体系 结构 中 只 可 以 对 处 理 器 寄存 器 中 的 操作 数 执行 算术 和 逻辑 运算 。 另 一 个 关 
键 的 不 同 之 处 是 指令 不 需要 放 在 一 个 单字 中 。 有 些 指令 可 能 占据 一 个 单字 ， 其 他 的 可 能 跨越 
多 个 字 。 

现代 CISC 处 理 器 中 的 指令 通常 不 使 用 三 地 址 指令 格式 。 大 多 数 算 术 和 逻辑 指令 使 用 二 地 
址 指令 格式 : 

操作 ”目的 操作 数 ， 源 操作 数 
这 种 类 型 的 Add 指令 为 : 
Add B,A 

该 指令 对 存储 器 操作 数 执行 B 一 [A] + [B] 操作 。 当 这 个 和 被 计算 出 来 时 ， 结 果 就 被 送 到 存储 
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器 中 并 存储 在 单元 B 中 ， 替 换 了 这 个 单元 中 原来 的 内 容 。 这 意味 着 存储 单元 B 既是 源 操作 数 
又 是 目的 操作 数 。 
再 考虑 一 下 将 两 个 数字 相 加 的 任务 : 
C=A+B 
其 中 三 个 操作 数 可 能 都 在 存储 单元 中 。 显 然 ， 这 不 能 通过 一 条 单独 的 二 地 址 指令 完成 。 可 以 通 
过 增加 另 一 条 二 地 址 指令 来 执行 这 个 任务 ， 该 二 地 址 指令 将 一 个 存储 单元 中 的 内 容 拷贝 到 另 一 
个 单元 中 。 就 像 下 面 的 这 条 指令 : 
Move C,B 
该 指令 执行 C 一 [B] 操作 ， 同 时 保留 单元 B 中 的 内 容 不 变 。 于 是 C 二 [A] + [B] 操作 现在 可 以 
用 两 条 指令 的 序列 来 完成 : 
Move C, B 
Add C,A 
可 以 观察 到 ， 通 过 使 用 这 个 指令 序列 ， 单 元 A 和 B 的 内 容 都 没有 被 覆盖 。 
在 一 些 CISC 处 理 器 中 ， 其 中 一 个 操作 数 可 能 在 存储 器 中 ， 但 男 一 个 必须 在 寄存 器 中 。 在 
这 种 情况 下 ， 完 成 所 需 任 务 的 指令 序列 可 以 是 : 


Move Ri, A 
Add Ri,B 
Move CGC. Ri 


Move 指令 的 一 般 形式 为 : 
Move destination, source 
其 中 源 操作 数 和 目的 操作 数 都 可 以 是 一 个 存储 单元 或 者 是 一 个 处 理 器 寄存 器 。Move 指令 包含 
了 Load 和 Store 指令 的 功能 ，Load 和 Store 指令 我 们 曾 在 前 面 RISC 风格 处 理 器 的 讨论 中 用 到 
过 。 在 Load 指令 中 ， 源 操作 数 是 一 个 存储 单元 而 目的 操作 数 是 一 个 处 理 器 寄存 器 。 在 Store 
指令 中 ， 源 操作 数 是 一 个 寄存 器 而 目的 操作 数 是 一 个 存储 单元 。Load 和 Store 指令 被 限定 在 存 
储 器 与 处 理 器 寄存 器 之 间 移 动 操作 数 ， 而 Move 指令 则 有 更 广泛 的 适用 范围 。 它 可 以 用 来 移动 
立即 操作 数 还 可 以 在 两 个 存储 单元 或 者 两 个 寄存 器 之 间 传 递 操作 数 。 


2.10.1 其 他 寻 址 方式 


大 多 数 CISC 处 理 器 都 有 所 有 的 五 种 基本 寻 址 方式 : 立即 方式 ， 寄 存 器 方式 ， 绝 对 方式 ， 
间接 方式 和 变 址 方式 。 在 CISC 处 理 器 中 通常 还 有 三 种 另外 的 寻 址 方式 。 

1， 自 动 增 量 和 自动 减 量 方式 

对 于 访问 存储 器 中 连续 单元 中 的 数据 项 和 栈 的 实现 来 说 ， 有 两 种 方式 特别 方便 。 

自动 增 量 方式 〈(autoincrement mode ) 一 操作 数 的 有 效 地 址 是 在 指令 中 指定 的 一 个 寄存 器 
的 内 容 。 在 访问 该 操作 数 后 ， 这 个 寄存 器 的 内 容 就 自动 增加 ， 指 向 存储 器 中 的 下 一 个 操作 数 。 

我 们 在 一 个 特定 的 寄存 器 外 加 括号 表示 这 个 寄存 器 中 的 内 容 要 用 作 有 效 地 址 ， 然 后 在 
后 边 写 一 个 加 号 表示 访问 过 操作 数 后 递增 寄存 器 的 值 ， 这 就 是 自动 增 量 方式 的 表示 形式 ， 
写作 : 

(Ri)+ 

为 了 在 一 个 32 位 字 长 的 按 字 节 寻 址 存储 器 中 访问 连续 的 字 ， 这 个 增 量 必须 是 4。 对 于 具有 自 
动 增 量 方式 的 计算 机 ， 它 可 以 用 与 被 访问 的 操作 数 大 小 相符 的 值 来 递增 寄存 器 中 的 内 容 。 因 
此 ， 对 于 一 个 字 节 大 的 操作 数 其 增 量 是 1， 对 于 16 位 的 操作 数 其 增 量 是 2， 对 于 32 位 的 操作 
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数 其 增 量 是 4。 因为 操作 数 的 大 小 通常 是 指令 操作 码 的 一 部 分 ， 所 以 用 (Ri)+ 来 表示 自动 增 量 
方式 就 足够 了 。 
与 自动 增 量 方式 相对 应 ， 还 有 一 种 逆序 访问 存储 单元 的 方式 : 
自动 减 量 方式 ( autodecrement mode ) 一 指令 中 指定 的 寄存 器 的 内 容 首先 做 自动 减 量 操作 ， 
然后 作为 这 个 操作 数 的 有 效 地 址 使 用 。 
我 们 在 一 个 特定 寄存 器 外 加 括号 ， 然 后 在 前 边 写 一 个 减 号 ， 表 示 在 把 寄存 器 的 值 读 取出 
来 用 作 有 效 地 址 之 前 ， 要 先 递减 寄存 器 的 值 ， 这 就 是 自动 减 量 方式 的 表示 形式 ， 写 作 : 
一 (RD 
在 这 种 方式 中 ， 操 作 数 按照 递减 地 址 的 顺序 进行 访问 。 
读者 可 能 会 感到 奇怪 ， 为 什么 在 自动 减 量 方式 中 地 址 在 使 用 之 前 要 先 做 递减 ， 而 在 自动 
增 量 方式 中 地 址 在 使 用 之 后 才 做 递增 。 这 样 做 的 主要 原因 是 为 了 更 容易 地 利用 这 些 方式 去 实现 
-个 栈 结构 。 我 们 不 需要 使 用 下 面 的 两 条 指令 : 
Subtract SP, #4 
Move (SP), NEWITEM 
来 将 一 个 新 项 压 入 栈 中 ， 而 只 需要 使 用 下 面 这 一 条 指令 来 完成 该 操作 : 
Move —(SP), NEWITEM 
同样 ， 也 不 需要 使 用 两 条 指令 : 
Move ITEM, (SP) 
Add SP, #4 
来 从 栈 中 弹出 一 个 项 ， 我 们 可 以 只 使 用 如 下 的 一 条 指令 来 完成 该 操作 : 
Move ITEM, (SP)+ 
2.， 相 对 方式 
我 们 已 经 用 处 理 器 的 通用 寄存 器 定义 了 变 址 方式 。 一 些 计算 机 还 在 这 种 方式 中 用 程序 计 
数 器 PC 代替 通用 寄存 器 进行 变 址 寻 址 。 这 时 ， 可 以 使 用 XGOPC) 来 对 一 个 存储 单元 进行 寻 址 ， 
该 存储 单元 离 程 序 计 数 器 当前 指向 的 位 置 有 X 个 字 节 的 距离 。 由 于 被 寻 址 的 单元 是 相对 于 程 
序 计 数 器 而 确定 的 ， 而 程序 计数 器 总 是 指向 一 个 程序 中 的 当前 执行 位 置 ， 所 以 相对 方式 的 名 字 
由 此 而 来 。 
相对 方式 (relative mode ) 
有 效 地 址 。 


2.10.2 ”条件 码 

处 理 器 执行 的 运算 通常 会 产生 如 正 数 、 负 数 或 0 这 样 的 结果 。 处 理 器 可 以 维护 着 这 些 结 
果 信 息 以 便 随 后 的 条 件 转 移 指令 使 用 。 这 可 以 通过 在 单独 的 位 中 记录 所 需要 的 信息 来 实现 ， 这 
些 位 通常 被 称 为 条 件 码 标 志 (condition code flags )。 这 些 标 志 通 常 被 集中 保存 在 一 个 叫做 条 件 
码 寄 存 器 ( condition code register ) 或 是 状态 寄存 器 (status register ) 的 特殊 处 理 器 寄存 器 中 。 
每 个 单独 的 条 件 码 标志 可 以 根据 所 执行 操作 的 结果 ， 被 设置 为 1 或 清除 为 0。 

四 个 常用 的 标志 是 : 

N (负数 ) 如 果 结 果 是 负数 则 置 为 1; 否则 清除 为 0。 

Z( 零 ) 如 果 结 果 是 0 则 置 为 1; 否则 清除 为 0。 

V (溢出 ) 如 果 发 生 算 术 溢 出 则 置 为 1; 否则 清除 为 0。 

C (进位 ) 如 果 运 算 结 果 有 一 个 进位 输出 则 置 为 1; 否则 清除 为 0。 





在 变 址 寻 址 方式 中 用 程序 计数 器 代替 通用 寄存 器 Ri 来 获得 
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N 和 Z 标志 记录 算术 或 逻辑 运算 的 结果 是 否 为 负数 或 零 。 在 一 些 计算 机 中 ， 它 们 还 可 能 
受 Move 指令 中 操作 数 的 值 的 影响 。 这 使 得 以 后 的 条 件 转移 指令 可 以 根据 被 移动 的 操作 数 的 符 


号 和 值 来 进行 转移 。 有 些 计 算 机 还 提供 一 条 特殊 的 Test 指令 ， 它 检查 寄存 器 或 存储 器 中 的 一 - 


个 值 但 不 修改 这 个 值 ， 并 根据 检查 的 情况 相应 地 设置 或 清除 N 和 ZZ 标志 。 

V 标志 表明 是 否 发 生 了 溢出 。 就 像 在 1.4 节 解 释 的 那样 ， 当 一 个 算术 运算 的 结果 超出 了 
操作 数 可 用 位 数 所 能 表示 的 值 的 范围 时 ， 就 产生 了 溢出 。 处 理 器 对 V 标志 进行 设置 ， 以 允许 
程序 员 去 测试 是 否 已 经 发 生 了 溢出 并 转移 到 一 个 适当 的 程序 中 去 处 理 这 个 问题 。 像 Branch_if_ 
overflow 这 样 的 指令 通常 就 是 为 这 一 目的 而 提供 的 。 

如 果 在 算术 运算 中 从 最 高 有 效 位 产生 一 个 进位 ，C 标志 就 被 置 为 1。 这 个 标志 使 得 在 执行 
算术 运算 中 的 操作 数 可 以 比 处 理 器 的 字 长 还 要 长 。 这 种 操作 可 以 用 在 多 精度 的 算术 运算 中 ， 这 
些 将 在 第 9 章 中 讨论 。 

考虑 一 下 图 2-6 中 的 Branch 指令 。 如 果 使 用 条 件 码 ， 只 要 寄存 器 R2 的 内 容 仍然 大 于 0， 
那么 Subtract 指令 将 会 使 得 N 和 ZZ 标志 都 被 清 为 0。 所 需 的 转移 可 以 简单 地 指定 为 : 

Branch>0 LOOP 
而 不 用 在 条 件 测试 中 指明 所 涉及 的 寄存 器 。 如 果 N 和 ZZ 都 不 是 1， 也 就 是 说 Subtract 指令 产生 
的 结果 既 不 为 负数 又 不 等 于 0， 那 么 这 条 指令 就 会 引起 一 个 转移 。 计 算 机 的 指令 集中 提供 了 很 
多 条 件 转移 指令 ， 以 满足 各 种 条 件 的 测试 。 这 些 条 件 被 定义 为 包含 条 件 码 标志 的 逻辑 表达 式 。 

为 了 说 明 条 件 码 的 使 用 ， 我 们 再 来 考虑 图 2-8 中 的 程序 ， 该 程序 是 用 RISC 风格 的 指令 将 
一 个 列表 中 的 数 相 加 。 如 果 使 用 CISC 风格 的 指令 ， 则 可 以 用 更 少 的 指令 来 实现 这 个 任务 ， 如 
图 2-26 所 示 。Add 指令 利用 指针 寄存 器 (R4 ) 去 访问 列表 中 连续 的 数 ， 并 将 它们 加 到 寄存 器 
R3 的 和 中 。 因 为 使 用 了 自动 增 量 寻 址 方式 来 指定 源 操 作 数 ， 所 以 在 访问 了 源 操作 数 之 后 ， 处 
理 器 自动 增加 该 指针 。Subtract 指令 用 来 设置 条 件 码 ， 然 后 该 条 件 码 会 被 Branch 指令 使 用 。 











Move R2, N 加 载 列表 的 大 小 
Clear R3 将 和 初始 化 为 0 
Move R4, #HNUMI1 加 载 第 一 个 数 的 地 址 

LOOP: Add R3, (R4)+ 把 下 一 个 数 加 到 和 中 
Subtract R2, #1 递减 计数 器 
Branch>0 LOOP 如 果 没 有 完成 就 循环 回 到 前 面 
Move SUM, R3 存储 最 终 的 和 






图 2-26 图 2-8 中 程序 的 CISC 版 本 


2.11 RISC 和 CISC 风格 


RISC 和 CISC 是 两 种 不 同 风格 的 指令 集 。 我 们 首先 介绍 了 RISC， 因 为 它 更 简单 ， 更 容易 
理解 。 在 看 到 这 两 种 风格 指令 集 的 基本 特征 后 ， 我 们 来 总 结 一 下 它们 的 主要 特点 : 
RISC 风格 指令 集 的 特点 是 : 
寻 址 方式 简单 。 
每 一 条 指令 都 能 放 到 一 个 单独 的 字 中 。 
由 于 寻 址 方式 简单 ， 所 以 指令 集中 的 指令 数 较 少 。 
只 能 对 处 理 器 寄存 器 中 的 操作 数 执行 算术 和 人 逻辑 运算 。 
Load/store 体系 结构 不 允许 从 一 个 存储 单元 直接 传输 数据 到 另 一 个 单元 ， 这 样 的 传输 必 
须要 通过 一 个 处 理 器 寄存 器 。 
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e 指令 简单 ， 这 有 助 于 处 理 单元 使 用 如 在 第 6 章 中 所 介绍 的 流水 线 技术 来 快速 地 执行 指令 。 

e 程序 的 大 小 往往 较 大 ， 因 为 执行 复杂 的 任务 需要 较 多 但 较 简 单 的 指令 。 

CISC 风格 指令 集 的 特点 是 : 

e@ 寻 址 方式 比较 复杂 。 

e 指令 比较 复杂 ， 一 条 指令 可 能 跨 多 个 字 。 

e 有 很 多 用 来 实现 复杂 任务 的 指令 。 

e 对 存储 器 中 的 操作 数 以 及 处 理 器 寄存 器 中 的 操作 数 都 可 以 执行 算术 和 逻辑 运算 。 

@ 通过 使 用 Move 指令 可 以 从 一 个 存储 单元 传输 数据 到 另 一 个 单元 。 

e 程序 的 大 小 往往 较 小 ， 因 为 执行 复杂 的 任务 需要 较 少 但 较 复杂 的 指令 。 

在 20 世纪 70 年 代 以 前 ， 所 有 计算 机 都 是 CISC 风格 的 。 这 样 做 的 一 个 重要 目的 是 通过 让 
硬件 执行 非常 复杂 的 任务 ， 从 而 简化 软件 的 开发 ， 换 言 之 ， 就 是 把 复杂 性 从 软件 层面 转移 到 硬 
件 层面 。 这 样 有 助 于 使 程序 变 得 更 简短 ， 在 计算 机 存储 器 比较 小 并 且 比 较 昂 贵 时 ， 这 是 很 重要 
的 。 而 如 今 ， 存 储 器 价格 低廉 ， 大 多 数 计算 机 都 有 大 容量 的 存储 器 。 

RISC 风格 的 设计 试图 通过 简单 的 硬件 来 实现 非常 高 的 性 能 ， 这 样 就 可 以 用 第 6 章 中 将 要 
讨论 的 流水 线 模式 快速 地 执行 指令 。 这 使 得 复杂 性 从 硬件 层面 转移 到 了 软件 层面 。 因 此 较 复杂 
的 编译 器 就 被 开发 了 出 来 ， 用 来 优化 由 简单 指令 组 成 的 代码 。 随 着 存储 器 容量 的 增加 ， 代 码 的 
大 小 已 变 得 不 那么 重要 了 。 

虽然 RISC 和 CISC 风格 看 起 来 像 是 定义 了 两 种 显著 不 同 的 方法 ， 但 现代 的 处 理 器 往往 是 
这 两 种 方法 的 一 个 折 中 。 例 如 ， 为 了 减少 所 执行 指令 的 数量 ， 可 以 在 RISC 处 理 器 中 加 入 一 些 
非 RISC 的 指令 ， 只 要 这 些 新 指令 能 被 很 快 地 执行 ， 这 将 是 很 有 吸引 力 的 。 我 们 将 在 第 6 章 中 
讨论 流水 线 概念 的 同时 ， 深 入 探讨 性 能 方面 的 问题 。 


2.12 ”实例 程序 
在 这 一 节 里 ,我 们 给 出 两 个 例子 来 进一步 说 明 机 颖 指令 的 使 用 。 这 些 例子 代表 了 数字 的 
和 非 数 字 的 应 用 。 


2.12.1 向 量 点 积 程序 

第 一 个 例子 是 一 个 关于 数字 的 应 用 程序 ， 它 是 前 面 那个 将 数字 相 加 的 程序 的 扩展 形式 。 
在 计算 中 包括 了 向 量 和 矩阵， 这 对 于 计算 两 个 向 量 的 点 积 通常 是 必要 的 。 假 设 A 和 B 是 两 个 
长 度 为 n 的 向 量 。 它 们 的 点 积 被 定义 为 : 


Pi 二 1 


点 积 = > 4(Dx BO 


图 2-27 和 图 2-28 分 别 给 出 了 计算 点 积 并 将 其 存储 到 存储 单元 DOTPROD 中 的 RISC 和 
CISC 风格 的 程序 。 每 个 向 量 的 第 一 个 元 素 4(0) 和 B(0) 被 存储 到 存储 单元 AVEC 和 BVEC 中 ， 
其 余 的 元 素 就 存储 在 随后 的 字 单 元 中 。 

这 种 累加 乘积 和 的 任务 常 出 现在 许多 信号 处 理应 用 中 。 在 这 种 情况 下 ， 其 中 的 一 个 向 
量 由 输入 到 信和 号 处 理 单元 的 连续 时 序 信和 号 中 取出 n 个 最 近 的 信和 号 样本 组 成 。 另 一 个 向 量 是 
n 个 权重 的 集合 。 这 n 个 信号 样本 乘 以 这 些 权重 ,上 骨 将 这 些 乘积 相 加 就 组 成 了 一 个 输出 信号 
样本 。 

有 些 计算 机 指令 集 将 图 2-27 和 图 2-28 程序 中 使 用 的 Multiply 和 Add 指令 操作 结合 起 来 ， 
成 为 一 条 单独 的 MultiplyAccumulate 指令 。 这 将 在 附录 D 中 介绍 的 ARM 处 理 器 中 说 明 。 


Move R2, #AVEC 
Move R3,#BVEC 
Load 

Clear 

Load 

Load 

Multiply 

Add 

Add 
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R2 指向 向 量 A 

R3 指向 向 量 B 

R4 作为 计数 器 

R5 累加 点 积 

获取 向 量 A 的 下 一 个 元 素 
获取 向 量 B 的 下 一 个 元 素 
计算 下 一 对 元 素 的 积 


累加 到 前 面 的 和 中 
增加 指向 向 量 A 的 指针 


Add , R3, 增加 指向 向 量 B 的 指针 
Subtract 递减 计数 器 
Branch_if_[R4]>0 如 果 没 有 完成 再 次 循环 
Store 将 点 积 保存 到 存储 器 中 





图 2-27 计算 两 个 向 量 点 积 的 RISC 风格 的 程序 


2.12.2 ”字符 串 搜索 程序 


R2, #AVEC R2 指向 向 量 A 
作为 非 数 字 应 用 的 一 个 例子 ， Move R3, #BVEC R3 0 B 
5 上 a Move R4 作为 计数 器 
我 们 来 考虑 一 下 字符 串 搜索 的 问 Clear R5 累加 点 积 
题 。 假 设 有 两 个 由 ASCII 编码 字 和 
ar u tip y 疝 一 组 天 人 
符 组 成 的 字符 串 ， 一 个 长 字符 串 Add ee 
人 和 一 个 短 字 名 也， 门 要 确定 Subtract R4, #1 递减 计数 器 
人 我 们 要 ee Branch>0 LOOP 如 果 没有 完成 再 次 循环 
目标 7 中 是 否 包 含 模式 P。 由 于 Move DOTPROD, R5 将 点 积 保存 到 存储 器 中 





可 能 会 在 7T 中 的 多 个 地 方 找到 PP， 
所 以 当 从 左 往 右 搜索 TT 时， 我 们 图 2-28 计算 两 个 向 量 点 积 的 CISC 风格 的 程序 
将 只 关心 了 在 7 中 的 第 一 次 出 现 ， 从 而 简化 我 们 的 任务 。 假 设 T 和 PP 分 别 包含 n 和 m 个 字符 ， 
其 中 /之 mo。 字符 存储 在 存储 器 中 连续 的 字 节 单元 中 。 假 设 所 需 的 数据 按 以 下 规定 放置 ， 

e 本 为 7(0) 的 地 址 ， 其 中 7(0) 为 字符 串 了 的 第 一 个 字符 。 

e N 是 一 个 值 为 n 的 32 位 字 的 地 址 。 

e P 为 P(0) 的 地 址 ， 其 中 P(0) 为 字符 串 PP 的 第 一 个 字符 。 

e M 是 一 个 值 为 m 的 32 位 字 的 地 址 。 

e RESULT 是 将 要 存储 搜索 结果 的 字 的 地 址 。 如 果 在 了 中 找到 了 子 字 符 串 P， 那 么 了 中 

相应 位 置 的 地 址 就 会 被 存放 在 RESULT 中 ; 和 否则， 就 会 在 RESULT 中 存放 值 -1。 

字符 串 搜索 是 一 个 重要 且 研 究 很 充分 的 问题 。 已 经 开发 了 很 多 算法 。 由 于 我 们 的 主要 目 
的 是 说 明 汇编 语言 指令 的 用 法 ， 所 以 我 们 将 使 用 最 简单 的 算法 ， 即 所 谓 的 brute-force 字符 串 搜 
索 算 法 。 它 在 图 2-29 中 给 出 。 

在 RISC 风格 的 计算 机 中 ， 这 个 算法 可 以 如 图 2-30 | for ieoton 一 mdo 


所 示 的 那样 去 实现 。 图 中 的 注释 说 明了 各 种 处 理 器 寄存 Te 
器 的 用 法 。 注 意 ， 在 搜索 失败 的 情况 下 ， 立 即 值 -1 将 Ft 





使 得 R8 的 内 容 等 于 0xFFFFFFFF， 即 -1 的 补 码 。 We. diy 
图 2-31 展示 了 这 个 算法 是 如 何在 CISC 风格 的 计算 
机 中 实现 的 。 观 察 到 LOOP2 中 的 第 一 条 指令 将 一 个 字符 ”图 2-29 用 brute-force 字符 串 搜索 算法 
从 字符 串 了 中 装 人 寄存 器 R8 中 ， 接 下 来 的 一 条 指令 将 搜索 字符 串 
这 个 字符 与 字符 串 P 中 的 字符 比较 。 读 者 可 能 会 感到 奇怪 ， 为 什么 不 能 使 用 这 样 的 单条 指令 
CompareByte (R6)+, (R7)+ 
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| 80 | 来 达到 相同 的 效果 。CISC 风格 指令 集 允许 操作 中 包含 存储 器 操作 数 ， 它 们 通常 这 样 要 求 : 如 果 
81 | ”一 个 操作 数 在 存储 器 中 ， 另 一 个 操作 数 就 必须 在 处 理 器 寄存 器 中 。 一 个 常见 的 例外 是 Move 指 
令 ， 它 可 能 包含 两 个 存储 器 操作 数 。 这 就 提供 了 一 种 在 不 同 的 存储 单元 中 移动 数据 的 简单 方法 。 


Move R2 指向 字符 串 7 
Move ; R3 指向 字符 串 忆 
Load 获取 值 n 
Load 获取 值 m 
Subtract , R4, 计算 nm 
Add sR: Tln-m) 的 地 址 
Add :R3, Plm) 的 地 址 
Move 用 R6 遍历 字符 串 了 
Move 用 R7 遍历 字符 串 P 
LoadByte 比较 字符 串 了 和 己 中 的 
LoadByte R9, (R7) 一 对 字符 
Branch_if_[R8]<[R9] NOMATCH 
Add R6, R6, #1 指向 了 中 的 下 一 个 字符 
Add R7, R7, #1 指向 P 中 的 下 一 个 字符 
Branch_if_[R5]>[R7] LOOP2 如 果 没 有 完成 再 次 循环 
Store R2, RESULT 存储 TUD 的 地 址 
Branch DONE 

NOMATCH: Add R2, R2, #1 指向 工 中 的 下 一 个 字符 
Branch_if_[R4] 三 [R2] ”LOOP1 如 果 没 有 完成 再 次 循环 
Move R8,#—1 写 人 -1 表明 没有 发 现 匹配 
Store R8, RESULT 
next instruction 





图 2-30 一 个 RISC 风格 的 字符 串 搜 索 程 序 


Move R2, #T R2 指向 字符 串 了 
Move R3, #P R3 指向 字符 串 PP 
Move R4,N 获取 值 n 
Move R5, M 获取 值 m 
Subtract R4, R5 计算 n-m 
Add R4,R2 Ttn-m) 的 地 址 
Add R5, R3 P(m) 的 地 址 
Move R6, R2 用 R6 遍历 字符 串 7 
Move R7, R3 用 R7 遍历 字符 串 P 
MoveByte R8, (R6)+ 比较 字符 串 T 和 PP 中 的 一 对 
CompareByte R8, (R7)+ Fe 
Branch#0 NOMATCH 
Compare R5, R7 检查 是 否 在 P(m) 中 
Branch >0 LOOP2 如 果 没 有 完成 再 次 循环 
Move RESULT, R2 存储 TD 的 地 址 
Branch DONE 

NOMATCH: Add R2, #1 指向 7 中 的 下 一 个 字符 
Compare R4, R2 检查 是 否 在 T(n-m) 中 
Branch >0 LOOPI1 如 果 没 完成 再 次 循环 
Move RESULT, #—1 没 发 现 匹配 


next instruction 





图 2-31 一 个 CISC 风格 的 字符 串 搜索 程序 


2.13 ”机 器 指令 的 编码 
在 这 一 章 中 ,我 们 已 经 介绍 了 各 种 有 用 的 指令 和 寻 址 方式 。 我 们 使 用 了 汇编 语言 的 一 般 
形式 去 强调 基本 概念 ， 而 避免 使 用 特定 处 理 器 的 首 字母 缩写 词 或 助 记 符 。 汇 编 语言 指令 以 符号 
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的 形式 表示 必须 由 处 理 器 电路 执行 的 操作 。 就 像 在 2.5 节 讨 论 的 那样 ， 为 了 在 处 理 器 中 执行 ， 
汇编 语言 指令 必须 由 汇编 程序 转换 成 机 器 指令 ， 这 些 机 器 指令 是 按 紧凑 的 二 进 制 模式 编码 的 。 
现在 我 们 来 研究 机 器 指令 的 几 种 可 能 的 格式 。Add 指令 
Add Rdst, Rsrcl, Rsrc2 


表示 的 是 操作 数 都 在 处 理 器 3 27 26 2 页 17 16 0 
寄存 器 Rdst、Rsrcl 和 Rsrc2 Re | Re | Re 

包含 目的 操作 数 和 两 个 源 操 a ) 寄存 器 -操作 数 格式 

作 数 。 如 果 处 理 器 有 32 个 

寄存 器 ， 那 么 这 就 需要 在 这 31 27 26 22 21 6 5 0 


每 一 个 寄存 器 。 如 果 每 条 指 


令 是 在 32 位 字 中 实现 的 ， 那 BE 

么 剩 下 的 17 位 可 以 用 来 指定 

OP 码 ， 表 明 将 要 执行 的 操 31 65 0 
作 。 在 图 2-32a 中 展示 了 一 立即 值 OP 码 
种 可 能 的 格式 。 c ) 调用 格式 


现在 考虑 一 类 指令 ， 其 
中 一 个 操作 数 使 用 立即 寻 址 
方式 给 出 ， 如 


2-32 ”可 能 的 指令 格式 


Add Rdst, Rsrc, #Value 
32 个 可 用 位 中 ， 需 要 10 位 来 指定 两 个 寄存 器 。 剩 下 的 22 位 必须 给 出 OP 码 以 及 立即 操作 数 
的 值 。 立 即 操作 数 最 常用 的 大 小 为 32 位 、16 位 和 8 位 。 由 于 不 可 能 为 立即 操作 数 分 配 32 位 ， 
所 以 一 个 较 好 的 选择 是 给 它 分 配 16 位 。 这 就 留 下 了 6 位 来 指定 OP 码 。 图 2-32b 中 给 出 了 一 
种 可 能 的 格式 。 这 个 格式 也 可 用 于 Load 和 Store 指令 ， 在 这 些 指令 中 变 址 寻 址 方式 使 用 16 位 
的 字段 去 指定 与 变 址 寄存 器 中 的 内 容 相 加 的 侦 移 量 。 

图 2-32b 中 的 格式 也 可 以 用 于 对 Branch 指令 进行 编码 。 考 虑 图 2-12 中 的 程序 。 如 果 寄 存 
器 RO0 的 内 容 为 0， 那 么 在 存储 器 地 址 128 中 的 Branch-greater-than 指令 可 以 用 特定 的 汇编 语言 
写成 

BGT R2,R0,LOOP 

寄存 器 R2 和 R0 可 以 在 图 2-32b 中 的 两 个 寄存 器 字段 中 指定 。6 位 的 OP 码 需 要 用 来 标记 BGT 
操作 。16 位 的 立即 数字 段 用 来 提供 确定 转移 目标 地 址 所 需要 的 信息 ， 即 指令 中 带 有 LOOP 标 
记 的 位 置 。 目 标 地 址 通常 由 32 位 组 成 。 由 于 没有 32 位 的 空间 ，BGT 指令 利用 立即 数字 段 给 
出 了 该 指令 在 程序 中 的 位 置 到 所 要 求 的 转移 目标 的 偏 移 量 。 在 BGT 指令 被 执行 的 时 候 ， 程 序 
计数 器 PC 的 值 已 被 增加 至 指向 下 一 条 指令 ， 即 在 地 址 132 中 的 Store 指令 。 因 此 ， 转 移 偏 移 
量 为 132-112 = 20。 由 于 处 理 器 是 通过 将 PC 的 当前 内 容 与 转移 偏 移 量 相 加 来 计算 目标 地 址 
的 ， 所 以 在 这 个 例子 中 所 需 的 偏 移 量 为 负数 ， 即 -20。 

最 后 ,我 们 应 该 来 考虑 一 下 用 来 调用 子 程序 的 Call 指令 。 它 只 需要 指定 OP 码 和 一 个 用 来 
确定 子 程序 第 一 条 指令 地 址 的 立即 值 。 如 果 使 用 6 位 来 指定 OP 码 ， 那 么 剩 下 的 26 位 可 以 用 
来 表示 立即 值 。 在 图 2-32c 中 给 出 了 这 种 格式 。 

在 本 节 中 ， 我 们 介绍 了 机 器 指令 编码 的 基本 概念 。 不 同 的 商用 处 理 器 具有 不 同 实现 细节 
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[4] ”的 指令 集 。 附 录 B 到 EE 中 我 们 选择 了 四 种 处 理 器 指令 集 作 为 例子 来 进行 介绍 。 
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2.14 结束语 

这 一 章 从 程序 员 的 角度 介绍 了 汇编 与 机 器 级 的 指令 和 程序 的 表示 与 执行 。 在 讨论 中 强调 
了 寻 址 技术 和 指令 序列 的 基本 原则 。 程序 设 计 示例 说 明了 使 用 现代 计算 机 指令 集 实现 操作 的 基 
本 类 型 。 介 绍 了 常用 的 寻 址 方式 。 对 子 程序 的 概念 和 实现 子 程序 所 需要 的 指令 也 进行 了 讨论 。 
在 本 章 的 讨论 中 ， 我 们 还 对 比 了 两 种 不 同 的 机 器 指令 集 ( RISC 和 CISC ) 的 设计 方法 。 


2.15 ”问题 解析 


本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解 决 这 样 的 问题 。 

问题 : 假设 有 一 个 由 ASCII 编码 字符 组 成 的 字符 串 存 放 在 存储 器 中 起 始 地 址 为 STRING 的 连续 单 
元 中 。 这 个 字符 串 以 回 车 (CR ) 符 结束 。 写 一 个 RISC 风格 的 程序 来 确定 字符 串 的 长 度 并 将 其 存储 在 
LENGTH 单元 中 . 

解答 : 图 2-33 给 出 了 一 个 可 能 的 程序 。 字符 串 中 的 字符 都 与 CR ( ASCII 码 为 0x0D ) 进行 比较 ， 递 
增 计数 器 直到 到 达 该 字符 串 的 末尾 。 


Move R2, #STRING ”R2 指向 字符 串 的 开始 处 
Clear R3 是 计数 器 并 被 清 为 0 
Move 回 车 符 的 ASCII 码 
LoadByte 获取 下 一 个 字符 
Branch_if [Rs5]= [R4] DONE 如 果 字 符 为 CR 则 结束 


Add R2, R2, #1 递增 字符 串 指针 

Add R3, R3, #1 递增 计数 器 

Branch LOOP 如 果 没 有 完成 ， 就 循环 回 到 前 面 
Store R3,LENGTH 将 计数 值 存放 在 单元 LENGTH 中 





图 2-33 例 2.1 的 程序 


问题 : 我 们 想 在 一 个 32 位 正 整 数 的 列表 中 找 出 最 小 的 数 。 在 找到 最 小 的 数 后 ， 把 它 的 值 存放 在 地 址 
为 1000 的 字 中 。 下 一 个 字 存 放 列 表 中 的 项 数 n。 接 下 来 的 n 个 字 保 存 列表 中 的 数 。 程 序 在 地 址 400 处 开 
始 。 写 一 个 RISC 风格 的 程序 来 找 出 最 小 的 数 ， 程 序 中 需 包 含 按 指 定 方式 组 织 程序 和 数据 所 需 的 汇编 指 
示 符 。 虽 然 程 序 必须 能 够 处 理 不 同 长 度 的 列表 ， 但 是 在 你 的 代码 中 只 需 包含 由 七 个 整数 组 成 的 样本 数据 
列表 。 

解答 : 图 2-34 中 的 程序 可 以 完成 所 需 的 任务 。 程 序 中 的 注释 说 明了 该 任务 是 如 何 执行 的 。 
例 2.3 

问题 : 写 一 个 RISC 风格 的 程序 将 一 个 位 的 十 进 制 整数 转换 成 二 进 制 数 。 这 个 十 进 制 数 以 个 
ASCII 编码 字符 的 形式 给 出 ， 就 像 在 键盘 中 键入 数字 的 情况 一 样 。 存 储 单元 N 中 存放 值 +"，ASCII 字符 串 
从 DECIMAL 处 开始 ， 转 换 后 的 数字 存放 在 BINARY 中 。 

解答 : 考虑 一 个 4 位 的 十 进 制 数 ，D=4d;dydido。。 这 个 数 的 值 为 (( 4d;x 10+qd;) x10+di) x 10+do。 该 
数字 的 这 种 表示 形式 是 图 2-35 中 程序 所 使 用 的 转换 技术 的 基础 。 注 意 ， 每 一 个 ASCII 编码 字符 在 它 用 于 
计算 之 前 都 被 转换 为 一 个 二 进 制 编码 的 十 进 制 ( Binary Coded Decimal，BCD ) 数字 。 这 里 假设 转换 后 的 
值 可 以 用 不 超过 32 个 位 来 表示 。 
例 2.4 

问题 : 考虑 一 个 数组 A(i, 站 ， 其 中 行 索引 从 三 0 到 nn-1， 而 列 索 引 从 .j=0 到 m-1。 这 个 数组 一 行 接 
一 行 地 存放 在 计算 机 存储 器 中 ， 每 行 的 元 素 占用 m 个 连续 的 字 单 元 。 假 设 存储 器 是 按 字 节 寻 址 的 且 字 长 
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为 32 位 。 写 一 个 RISC 风格 的 子 程序 ， 将 第 x 列 与 第 y 列 逐个 元 素 地 相 加 ， 将 和 元 素 存放 在 第 y 列 中 。 
索引 x 和 yy 通过 寄存 器 R2 和 R3 传递 给 子 程序 。 参 数 n 和 m 通过 寄存 器 R4 和 R5 传递 给 子 程序 ， 元 素 


A(0,0) 的 地 址 通过 寄存 器 R6 传递 。 
EQU 


ORIGIN 

Move 

Load 

Add 

Load 

Subtract 
Branch_if_[R3]= 0 
Add 

Load 
Branch_if_[RS]<[R6] 
Move 

Branch 

Store 


ORIGIN 
RESERVE 
DATAWORD 


DATAWORD 4,5,3,6, 


END 


1000 


400 

R2, #LIST 
R3, 4(R2) 
R4, R2, #8 
R5, (R4) 
R3, R3, #1 
DONE 
R4, R4, #4 
R6, (R4) 
LOOP 

R5, R6 
LOOP 
RS5, (R2) 


1000 

4 

时 
1,8,2 





列表 的 起 始 地 址 


R2 指向 列表 的 开始 处 

R3 是 一 个 计数 器 ， 初 始 化 为 天 

R4 指向 第 一 个 数 

R5 保存 着 目前 为 止 找 到 的 最 小 的 数 
递减 计数 器 

如 果 R3 等 于 0 则 结束 

递增 列表 指针 

获取 下 一 个 数 

检查 是 否 已 找到 最 小 的 数 

更 新 已 找到 的 最 小 的 数 


将 最 小 的 数 存 到 SMALL 中 
找到 的 最 小 的 数 的 空间 


列表 中 的 项 数 
列表 项 


图 2-34 例 2.2 的 程序 


Load 
Move 
Clear 
LoadByte 
And 

Add 

Add 
Subtract 
Branch_if_[R2]= 0 
Multiply 
Branch 
Store 


图 


R2, N 

R3, #DECIMAL 
R4 

R5, (R3) 

R5, RS, #0xOF 
R4, R4, R5 
R3, R3, #1 

R2, R2, #1 
DONE 

R4, R4, #10 
LOOP 

R4, BINARY 


2-35 


初始 化 计数 器 R2 为 n 
R3 指向 ASCII 数字 

R4 存放 二 进 制 数 
获取 下 一 个 ASCII 数字 
形成 BCD 数字 

加 到 中 间 结 果 中 
递增 数字 指针 

递减 计数 器 


乘 以 10 
如 果 没 有 完成 循环 回 到 前 面 
将 结果 存 到 单元 BINARY 中 





例 2.3 的 程序 


解答 :图 2-36 给 出 了 一 个 可 能 的 程序 。 我 们 假设 值 x*、y、n 和 m 存放 在 存储 单元 X、Y、N 和 M 中 。 
同样 ， 数 组 的 元 素 也 存放 在 以 ARRAY 单元 开始 的 连续 的 字 中 ，ARRAY 单元 就 是 元 素 A(0,0) 的 地 址 。 程 


序 中 的 注释 说 明 每 条 指令 的 目的 。 


问题 : 我们 想 要 对 存放 在 存储 器 中 的 一 个 字符 列表 进行 排序 。 这 个 列表 包含 个 字 节 ， 且 每 个 字 节 
都 包含 从 A 到 ZzZ 的 字母 集合 中 一 个 字符 的 ASCI 码 。 在 第 1 章 介 绍 过 的 ASCI 码 中 ， 字 母 A、B、…、 
Z 用 具有 递增 数值 的 7 位 二 进 制 模式 表示 。 当 一 个 ASCII 码 字符 存储 在 一 个 字 节 单元 中 时 ， 习 惯 上 会 将 
其 最 高 有 效 位 置 为 0。 利用 这 种 编码 ， 我 们 可 以 通过 将 字符 的 编码 ( 将 它们 作为 正 数 ) 按 数字 递增 的 顺 
序 排序 以 此 来 将 字符 列表 按 字 母 顺序 进行 排序 。 

假设 这 个 列表 存储 在 从 LIST 到 LIST + n =- 1 的 存储 单元 中 ，n 为 存储 在 地 址 N 处 的 32 位 值 。 排 序 
要 在 适当 的 位 置 进行 ， 也 就 是 说 ， 排 序 后 的 列表 要 与 原始 列表 占用 相同 的 存储 单元 。 


86 
87 


58 . 第 2 章 指令 集体 系 结构 


Load 

Load 

Load 

Load 

Move 

Call 

next instruction 


Subtract 
Store 
LShiftL 


Subtract 
LShiftL 
LShiftL 
Add 
Add 
Load 
Load 
Add 
Store 
Add 
Add 
Subtract 
Branch_if_[R4]>0 


R5, M 
R6, #ARRAY 


SP, SP, #4 


加 载 值 x 
加 载 值 y 
加 载 值 ” 
加 载 值 m 
加 载 A(0,0) 的 地 址 


保存 寄存 器 R7 
确定 一 列 中 连续 的 元 素 之 间 的 


距离 ( 以 字 节 为 单位 ) 


计算 y-x 

计算 40 一 如 

计算 4x 

R6 指向 A(0x) 

R7 指向 A(0,y) 

获取 第 x 列 中 的 下 一 个 数 
获取 第 y 列 中 的 下 一 个 数 
将 这 些 数 相 加 并 存储 和 


递增 指向 第 x 列 的 指针 

递增 指向 第 列 的 指针 
递减 行 计 数 器 

如 果 没 有 完成 则 循环 回 到 前 面 
恢复 R7 


返回 到 调用 程序 





图 2-36 例 2.4 的 程序 


我 们 可 以 利用 直接 选择 排序 算法 对 列表 进行 排序 。 首 先 ， 找 到 最 大 的 数 并 将 其 放 到 列表 末尾 的 单元 
LIST+n 一 1 中。 然后 将 剩 下 的 n-1 个 数 的 子 列表 中 最 大 的 数 放 到 子 列表 末尾 的 单元 LIST+n -2 中 。 重 
复 这 个 过 程 直 到 列表 被 排序 完毕 。 在 图 2-37 中 展示 了 这 个 排序 算法 的 C 语言 程序 ， 在 该 程序 中 列表 被 视 
为 一 个 从 LIST(0) 到 LIST(n-1) 的 一 维 数组 。 对 每 一 个 从 LISTO) 到 LIST(0) 的 子 列表 ，LISTO) 中 的 数 都 
要 与 子 列表 中 每 一 个 其 他 的 数 进行 比较 。 每 当 在 子 列表 中 找到 一 个 更 大 的 数 ， 就 将 它 与 LISTO) 中 的 数 进 


行 交换 。 


for (= n-l;j> 0;j= j- 1) 


{for (k= j-l;k>= 0;:k=k-1) 

(LIST[k] > LIST[U]) 

{ TEMP = LIST[k]; 
LIST[k] = LISTTj]; 


{ 让 


LISTUD] = TEMP; 





图 2-37 实现 排序 的 C 语言 程序 


注意 ，C 语言 程序 是 向 后 遍历 列表 的 。 当 编写 机 器 语言 程序 时 ， 这 种 遍历 顺序 将 简化 循环 的 终止 ， 


因为 当 索 引 减 到 0 时 就 退出 循环 。 


写 一 个 CISC 风格 的 程序 ， 实 现 该 排序 任务 。 
解答 : 图 2-38 给 出 了 一 个 可 能 的 程序 。 
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Move R2,#LIST ”加 载 LIST 到 基 址 寄存 器 R2 中 

Move R3,N 初始 化 外 部 循环 的 索引 寄存 器 R3 

Subtract R3, #1 为 j=n-1 

Move R4, R3 初始 化 内 部 循环 的 索引 寄存 器 R4 

Subtract R4, #1 为 三 j-1 

MoveByte R5, (R2,R3) 加 载 LIST (7) 到 Rs 中，R5 保存 
着 当前 子 列 表 中 的 最 大 值 

CompareByte (R2,R4), R5 “如果 LIST(K) 二 [R5]， 则 不 交换 

Branch <0 NEXT 

MoveByte R6, (R2,R4) ”否则 ， 将 LIST(k) 和 LISTOY) 交换 ， 

MoveByte (R2,R4), R5 ”并 将 新 的 最 大 值 装 入 R5 中 

MoveByte (R2,R3), R6 

MoveByte 寄存 器 R6 作为 TEMP 

Decrement 递减 变 址 寄存 器 R4 和 R3， 它 们 也 

Branch >0 作为 循环 计数 器 ， 在 循环 没有 完成 

Decrement 时 就 跳 转 回 前 面 

Branch>0 - 





图 2-38 一 个 字 节 排序 程序 


习题 

[E] 2.1 在 一 些 存 储 单元 中 给 出 一 个 二 进 制 模 式 ， 是 否 能 说 明 这 个 模式 表示 的 是 一 条 机 器 指令 还 是 一 个 
数字 ? 

[E] 2.2 考虑 一 台 计 算 机 ， 它 有 一 个 按 字 节 寻 址 的 存储 器 ， 该 存储 器 按照 大 端 策略 组 织 为 32 位 的 字 的 集 

合 。 一 个 程序 读 取 在 键盘 上 输入 的 ASCI 字符 并 将 它们 存储 到 从 单元 1000 开始 的 连续 字 节 单元 
中 。 在 输入 单词 “Computer” 后 ， 说 明 单元 1000 和 1004 中 两 个 存储 字 的 内 容 。 
[E] 2.3 针对 小 端 策略 重复 习题 2.2 中 的 问题 。 
[E] 2.4 在 使 用 以 下 每 种 寻 址 方式 去 访问 一 个 存储 器 操作 数 之 前 ， 寄 存 器 R4 和 了 R5 包含 着 十 进 制 数 2000 
和 3000。 在 每 一 种 情况 中 有 效 地 址 ( EA ) 是 多 少 ? 
(a) 12 (R4) 
(b) (R4,R5 ) 
(c) 28 (R4,R5 ) 
(d)(R4) + 
(e)—(R4) 

[E] 2.5 写 一 个 RISC 风格 的 程序 ， 计 算 表达 式 SUM = 580 + 68 400 + 80 000。 

[E] 2.6 写 一 个 CISC 风格 的 程序 完成 习题 2.5 中 的 任务 。 

[E] 2.7 写 一 个 RISC 风格 的 程序 ， 计 算 表 达 式 ANSWER =AxBxCxD。 

[E] 2.8 写 一 个 CISC 风格 的 程序 完成 习题 2.7 中 的 任务 。 

[M] 2.9 重 写 图 2-8 中 的 加 法 循环 ， 使 得 列表 中 的 数字 可 以 以 相反 的 顺序 被 访问 ; 也 就 是 说 ， 第 一 个 被 访 

问 的 数 是 列表 中 的 最 后 一 个 ， 最 后 一 个 被 访问 的 数 在 存储 单元 NUM1 中 。 尝 试 实现 最 有 效 的 确 
定 循环 终止 的 方法 。 你 的 循环 是 否 比 图 2-8 中 的 循环 执行 得 更 快 ? 

[M] 2.10 将 图 2-10 所 示 的 学 生成 绩 列表 修改 为 每 个 学 生 包 含有 j 项 测验 分 数 。 假 设 有 个 学 生 。 写 一 个 
RISC 风格 的 程序 ， 计 算 每 项 测验 的 分 数 和 ， 并 将 这 些 和 存储 在 存储 器 中 地 址 为 SUM、SUM+4、 
SUM+8、… 的 字 单 元 中 。 由 于 测验 的 数量 /7 比 处 理 器 中 的 寄存 器 数量 要 大 ， 所 以 图 2-11 所 示 的 
用 于 3 项 测验 的 程序 已 不 能 被 使 用 。 应 该 使 用 两 个 戏 套 循环 。 内 部 循环 累加 每 项 特定 测验 的 和 ， 
而 外 部 循环 遍历 测验 的 数目 j。 假设 用 来 存放 和 的 存储 区 域 最 初 已 被 清除 为 零 。 

[M] 2.11 写 一 个 RISC 风格 的 程序 ， 在 包含 个 32 位 整数 的 列表 中 找 出 负数 的 个 数 ， 并 将 计数 结果 存 
储 在 单元 NEGNUM 中 。 值 ”存储 在 存储 单元 N 中 ,列表 中 第 一 个 整数 存储 在 单元 NUMBERS 


88 
89 


60 : 第 2 章 指令 集体 系 结构 


中 。 程 序 要 包含 必要 的 汇编 指示 符 和 一 个 含有 六 个 数 的 样本 列表 ， 其 中 有 一 些 数 是 负数 。 
[E] 2.12 以 下 两 个 语句 段 都 可 以 将 值 300 存储 在 单元 1000 中 ,但 是 却 是 在 不 同 的 时 间 完 成 的 。 
ORIGIN 1000 
DATAWORD 300 


以 及 
Move R2,#1000 
Move R3,#300 
Store  R3,( R2) 


[E] 2.13 参照 图 2-13 的 风格 为 图 2-11 中 的 程序 写 一 个 汇编 语言 程序 。 假 设 采 用 图 2-10 中 的 数据 布局 。 
[E] 2.14 写 一 个 CISC 风格 的 程序 完成 例 2.1 中 的 任务 。 一 条 指令 最 多 可 以 有 一 个 操作 数 在 存储 器 中 。 
[M] 2.15 写 一 个 CISC 风格 的 程序 完成 例 2.2 中 的 任务 。 一 条 指令 最 多 可 以 有 一 个 操作 数 在 存储 器 中 。 
[M] 2.16 写 一 个 CISC 风格 的 程序 完成 例 2.3 中 的 任务 。 一 条 指令 最 多 可 以 有 一 个 操作 数 在 存储 器 中 。 
[M] 2.17 写 一 个 CISC 风格 的 程序 完成 例 2.4 中 的 任务 。 一 条 指令 最 多 可 以 有 一 个 操作 数 在 存储 器 中 。 
[M] 2.18 写 一 个 RISC 风格 的 程序 完成 例 2.5 中 的 任务 。 
[E] 2.19 在 一 个 程序 中 寄存 器 R5 用 来 指向 一 个 包含 32 位 数 的 栈 的 栈 项 。 使 用 变 址 、 自 动 增 量 和 自动 减 
量 寻 址 方式 写 一 个 指令 序列 ， 执 行 以 下 的 各 个 任务 : 
(a ) 弹出 栈 顶 部 的 两 项 内 容 ， 将 它们 相 加 ， 然 后 将 结果 压 人 栈 中 。 
(b ) 从 栈 顶 将 第 五 项 内 容 拷贝 到 寄存 器 R3 中 - 
(c ) 从 栈 中 删除 栈 项 部 的 10 项 内 容 。 
对 于 每 一 种 情况 ， 假 设 栈 都 包含 10 个 或 更 多 的 元 素 。 
[M] 2.20 在 图 2-18 的 程序 中 ， 下 列 每 一 条 指令 执行 之 后 ， 写 出 此 时 处 理 器 栈 的 内 容 和 栈 指针 SP 的 内 容 。 
假设 在 调用 程序 开始 执行 之 前 ，[SP]=1000， 且 在 第 一 级 上 。 
(a ) 子 程序 中 第 二 条 Store 指令 
(b ) 子 程序 中 最 后 一 条 Load 指令 
(c ) 调用 程序 中 最 后 一 条 Store 指令 
[M] 2.21 一 个 子 程序 的 返回 地 址 可 保存 在 : 
(a) 处 理 器 的 寄存 器 中 
(b ) 一 个 与 调用 有 关 的 存储 单元 中 ， 因 此 当 子 程序 从 不 同 的 地 方 被 调用 时 将 使 用 不 同 的 单元 
(c ) 一 个 堆栈 中 
在 这 些 可 能 性 中 哪 一 种 支持 子 程序 肉 套 ?” 哪 一 种 支持 子 程序 递归 ( 也 就 是 子 程序 调用 它 自身 )? 
[M] 2.22 除 处 理 器 栈 之 外 ,在 一 些 程序 中 使 用 另外 一 个 栈 可 能 会 更 加 方便 。 通 常 在 存储 器 中 为 第 二 个 栈 
分 配 固定 大 小 的 空间 。 在 这 种 情况 下 ， 当 栈 已 达到 其 最 大 大 小 时 ， 需 要 避免 再 把 一 个 项 压 入 栈 
中 。 同 样 也 要 避免 从 一 个 空 栈 中 弹出 一 个 项 ， 这 可 能 是 由 一 个 编程 错误 引起 的 。 写 两 个 简短 的 
RISC 风格 的 程序 ， 分 别 叫做 SAFEPUSH 和 SAFEPOP， 用 于 压 人 和 弹出 这 个 栈 结构 ， 同 时 避免 
这 两 个 可 能 出 现 的 错误 。 假设 将 被 压 人 或 弹出 的 元 素 位 于 寄存 器 R2 中 ,寄存器 R5 作为 这 个 用 
户 栈 的 栈 指针 。 如 果 栈 中 最 顶层 的 元 素 存 放 在 单元 TOP 中 ， 那 么 这 个 栈 就 满 了 ， 如 果 最 后 弹出 
的 元 素 存放 在 单元 BOTTOM 中 ,那么 这 个 栈 就 是 空 的 。 如 果 发 生 错 误 ， 程 序 就 应 该 相应 地 跳 
转 到 FULLERROR 和 EMPTYERROR 中 。 假 设 所 有 的 元 素 都 是 一 个 字 的 大 小 ， 并 且 栈 向 较 低 编 
号 的 地 址 单元 增长 。 
[M] 2.23 重复 习题 2.22 中 的 问题 ， 写 一 个 CISC 风格 的 程序 ， 可 以 使 用 自动 增 量 和 自动 减 量 寻 址 方式 。 
[D] 2.24 另外 有 一 个 类 似 于 栈 的 有 用 的 数据 结构 称 为 队列 (queue )。 将 数据 存储 到 队列 中 和 从 队列 中 取 
出 数据 都 是 基于 先进 先 出 (FIFO ) 方法 的 。 因 此 ， 如 果 我 们 假设 队列 在 存储 器 中 朝 地 址 增加 
的 方向 增长 ( 这 是 普遍 的 做 法 )， 新 的 数据 就 被 加 到 队列 的 后 面 ( 高 地 址 端 )， 而 从 队列 的 前 面 
(低地 址 端 ) 取出 数据 。 
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栈 和 队列 的 实现 有 两 个 重要 的 差异 。 栈 的 一 端 是 固定 的 〈 底部 )， 另 一 端 随 着 数据 的 压 和 信和 弹出 
而 升 高 和 降低 。 在 任何 时 候 都 只 需要 一 个 指向 栈 的 顶部 的 指针 。 而 另 一 方面 ， 随 着 数据 从 后 面 加 
和 人 和 从 前 面 移 出 ， 队 列 的 两 端 都 会 移 向 更 高 的 地 址 ， 所 以 需要 两 个 指针 来 跟踪 队列 的 两 端 。 
一 个 FIFO 的 字 节 队列 是 在 存储 器 中 实现 的 ， 它 占用 K 个 字 节 的 固定 区 域 。 所 需 的 指针 有 IN 指 
针 和 OUT 指针 。IN 指针 跟踪 下 一 个 将 被 加 入 到 队列 后 面 的 字 节 的 位 置 ， 而 OUT 指针 跟踪 包含 
下 一 个 将 要 从 队列 前 面 移出 的 字 节 的 位 置 。 
(a ) 随 着 数据 项 加 入 到 队列 中 ， 它 们 被 加 到 连续 的 高 地 址 中 ， 直 至 到 达 存 储 区 域 的 末端 。 那 么 当 
一 个 新 的 项 要 加 入 到 队列 中 的 时 候 ， 接 下 来 会 发 生 什 么 呢 ? 
(b ) 为 IN 指针 和 OUT 指针 选择 一 个 合适 的 定义 ， 指 出 它们 在 这 个 数据 结构 中 指向 什么 地 方 。 
用 一 个 简单 的 图 说 明 你 的 答案 。 
(c) 如 果 队 列 的 状态 只 用 两 个 指针 描述 ， 说 明 队 列 完全 满 和 完全 空 这 两 种 情况 是 难以 区 分 的 。 
(d) 为 了 解决 (c ) 部 分 中 的 问题 需要 增加 什么 条 件 ? 
(e) 给 出 一 个 程序 ， 使 其 可 以 操作 两 个 指针 IN 和 OUT 来 向 队列 增加 数据 项 和 从 队列 中 删除 数 
据 项 。 
[M] 2.25 考虑 习题 2.24 中 描述 的 队列 结构 。 写 出 APPEND 和 REMOVE 程序 使 得 数据 可 以 在 处 理 器 寄存 
器 和 队列 之 间 传 输 。 每 当 试图 或 正在 执行 一 个 操作 时 ， 都 要 仔细 检查 和 更 新 队列 和 指针 的 状态 。 
[M] 2.26 在 2.12.1 节 中 讨论 了 点 积 计算 。 这 种 类 型 的 计算 可 以 用 于 以 下 信号 处 理 的 任务 。 一 个 输入 信号 
时 间 序 列 IN (0), IN (1), IN (2), IN (3), … 被 一 个 三 元 素 的 权重 向 量 ( WT (0), WT (1)， 
WT (2 ))=( 1/8, 1/4, 1/2 ) 进行 处 理 ， 产 生 一 个 如 下 的 输出 信号 时 间 序 列 OUT (0), OUT (1 )， 
OUT (2), OUT (3), 
OUT (0)=WT (0)x IN(0)+WT (1)x IN(1)+WT (2)x IN (2) 
OUT (1)=WT (0)x IN(1)+WT (1)x IN(2)+WT (2)x IN(3) 
OUT (2)=WT (0)x IN(2)+WT (1)x IN(3)+WT(2)x IN(4) 
OUT (3)=WT (0)x IN(3)+WT (1)x IN(4)+WT (2)xIN(5) 


所 有 的 信号 和 权重 值 都 是 32 位 的 有 符号 数 。 权重 、 输 入 和 输出 分 别 被 存放 在 存储 器 中 以 WT、 
IN 和 OUT 为 起 始 的 单元 中 。 写 一 个 RISC 风格 的 程序 计算 并 存储 前 个 输出 的 值 ， 其 中 4 存 
储 在 单元 N 中 。( 提示 : 算术 右 移 可 以 用 来 做 乘法 。 ) 

[M] 2.27 写 一 个 子 程序 MEMCPY 将 主 存 中 一 个 区 域 的 字 节 序 列 复 制 到 另 一 个 区 域 中 。 这 个 子 程序 可 以 
接收 三 个 在 寄存 器 中 的 输入 参数 ， 分 别 表示 源 ( from ) 地 址 ， 目 的 (to ) 地址 和 将 要 复制 的 序 
列 的 长 度 (length )。 这 两 个 区 域 可 能 会 有 重合 。 除 了 这 一 种 情况 以 外 ， 在 其 他 所 有 情况 下 ， 这 
个 子 程序 都 应 该 按 地 址 递增 的 顺序 复制 这 些 字 节 。 但 是 ,在 目的 地 址 落 在 将 要 复制 的 字 节 序列 
中 ， 即 目的 地 址 to 在 from 到 ffom+length-1l 之 间 的 情况 下 ， 为 了 防止 覆盖 还 没有 被 复制 的 字 
节 ， 子 程序 必须 从 将 要 复制 的 字 节 序列 的 末端 开始 按 地 址 递减 的 顺序 复制 这 些 字 节 。 

[M] 2.28 写 一 个 子 程序 MEMCMP 对 主 存 中 的 两 个 字 节 序列 逐个 字 节 地 进行 比较 。 这 个 子 程序 可 以 接收 
三 个 在 寄存 器 中 的 输入 参数 ， 分 别 表 示 第 一 个 ( first ) 序列 的 地 址 ， 第 二 个 ( second ) 序列 的 地 
址 和 将 要 比较 的 序列 的 长 度 (length )。 还 需要 使 用 一 个 寄存 器 来 返回 比较 中 不 匹配 的 次 数 。 

[M] 2.29 写 一 个 子 程序 EXCLAM， 它 接收 一 个 在 寄存 器 中 的 参数 ， 该 参数 表示 一 个 保存 在 连续 字 节 中 的 
ASCII 码 字符 串 在 主 存 中 的 起 始 地 址 STRING， 这 个 字符 串 可 以 代表 任意 的 句子 集合 ， 并 以 控 
制 字符 NUL ( 值 0 ) 结尾 。 这 个 子 程序 需要 从 地 址 STRING 开始 扫描 字符 串 ， 将 每 一 个 出 现 的 
句号 (“.”) 替换 成 感叹 号 (“!”)。 

[M] 2.30 写 一 个 子 程序 ALLCAPS， 它 接收 一 个 在 寄存 器 中 的 参数 ， 该 参数 表示 一 个 保存 在 连续 字 节 中 
的 ASCII 码 字 符 串 在 主 存 中 的 起 始 地 址 STRING， 并 以 控制 字符 NUL ( 值 0 ) 结尾 。 这 个 子 程 
序 需 要 从 地 址 STRING 开始 扫描 字符 串 ， 将 每 一 个 出 现 的 小 写字 母 (“a” 一 “z”) 替换 成 相应 
的 大 写字 母 (“A” 一 “Z”)。 
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[M] 2.31 写 一 个 子 程序 WORDS， 它 接收 一 个 在 寄存 器 中 的 参数 ， 该 参数 表示 一 个 保存 在 连续 字 节 中 
的 ASCII 码 字符 串 在 主 存 中 的 起 始 地 址 STRING ， 并 以 控制 字符 NUL ( 值 0 ) 结尾 。 这 个 字符 
串 表示 单词 间 有 空格 字符 的 英文 文本 。 这 个 子 程序 必须 确定 字符 串 中 单词 的 个 数 (除了 标点 符 
号 )。 它 必须 通过 寄存 器 将 结果 返回 给 调用 程序 。 

[D] 2.32 写 一 个 子 程序 NSERT， 将 一 个 数字 放 到 一 个 按 值 升序 存储 的 正 数列 表 中 正确 的 位 置 。 需 要 通 
过 寄存 器 向 这 个 子 程序 传递 三 个 输入 参数 ， 分 别 表示 排序 数字 列表 的 起 始 地 址 ， 列 表 的 长 度 和 
将 被 插入 列表 中 的 新 值 。 该 子 程序 需要 在 列表 中 为 新 值 找 到 适当 的 位 置 ， 然 后 将 所 有 较 大 的 数 
字 向 上 移动 一 个 位 置 ， 在 列表 中 创建 空间 来 存储 新 值 。 

[D] 2.33 写 一 个 子 程序 INSERTSORT， 重 复 使 用 习题 2.32 中 的 INSERT 子 程序 ， 将 一 个 无 序 的 数字 列表 
创建 成 一 个 将 这 些 数 字 按 递增 顺序 排列 的 新 列表 。 这 个 子 程序 需要 接收 三 个 在 寄存 器 中 的 输入 
参数 ， 分 别 表示 无 序数 字 序列 的 起 始 地 址 OLDLIST， 列 表 的 长 度 和 有 序数 字 序列 的 起 始 地址 
NEWLIST。 
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基本 输入 /输出 





本 章 目 标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 处 理 器 与 输入 /输出 (IO ) 设备 之 间 的 数据 传输 

e 从 程序 员 的 角度 看 IO 传输 

e 如 何 使 用 轮 询 方式 执行 程序 来 控制 IO 

e 如 何在 IO 传输 中 使 用 中 断 

计算 机 的 一 个 基本 特性 是 具有 与 其 他 设备 交换 信息 的 能 力 。 这 一 通信 和 能力 使 操作 员 可 以 
完成 很 多 操作 ， 例 如 用 键盘 和 显示 屏幕 来 处 理 文本 和 图 形 。 实 际 中 ， 我 们 广泛 地 使 用 计算 机 
通过 Internet 与 其 他 计算 机 通信 并 访问 全 球 信 息 。 此 外 ， 在 其 他 应 用 中 ， 计 算 机 虽然 不 是 很 明 
显 ， 但 仍 有 着 同等 重要 的 作用 。 它 们 是 构成 家 用 电器 、 制 造 设备 、 运 输 系 统 、 银 行 和 销售 点 终 
端 所 必需 的 一 部 分 。 在 这 些 应 用 中 ， 计 算 机 的 输入 可 能 来 自传 感 器 开关 、 数 字 照 相机 、 麦 克 风 
或 火警 报警 器 ; 输出 可 能 是 发 送 给 扬声器 的 声音 信和 号 或 者 是 用 来 改变 发 动机 速度 、 打 开 阀 门 或 
使 机 器 人 按 指定 方式 移动 的 数字 编码 指令 。 简 而 言 之 ， 计 算 机 应 具有 在 不 同 环境 下 与 多 种 设备 
交换 数字 信息 或 模拟 信息 的 能 力 。 

在 本 章 中 ， 我 们 将 从 程序 员 的 角度 来 分 析 计 算 机 的 输入 /输出 (IO ) 功能。 我 们 只 介绍 
所 有 计算 机 都 提供 的 基本 LO 操作 ， 这 将 使 读者 可 以 在 典型 的 教学 实验 环境 中 的 设备 上 完成 有 
趣 并 有 用 的 练习 。 更 复杂 的 LO 方案 ， 以 及 实现 IO 功能 所 需要 的 硬件 将 在 第 7 章 中 讨论 。 


3.1 访问 1/O 设备 


计算 机 系统 的 部 件 之 间 通 过 互连网 络 进行 通信 ， 如 图 3-1 所 示 。 互 连 网 络 包 含 了 在 处 理 
器 、 存 储 器 和 一 些 IO 设备 之 间 进 行 信息 传输 所 需 的 电路 。 

在 第 2 章 中 ， 我 们 描述 了 地 址 空间 的 概念 
以 及 处 理 器 如 何 访问 地 址 空间 中 独立 的 存储 单 
元 。Load 和 Store 指令 使 用 寻 址 方式 来 产生 识别 
所 需 单 元 的 有 效 地 址 。 这 种 使 用 地 址 来 访问 存储 
器 中 不 同 单元 的 思想 也 可 以 扩展 到 IO 设备 的 处 
理 上 。 为 此 ， 每 个 IO 设备 在 处 理 器 看 来 必须 包 
括 一 些 可 寻 址 的 单元 ， 就 像 存 储 器 一 样 。 处 理 器 
将 地 址 空间 中 的 一 些 地 址 分 配给 这 些 1O 单元 ， 
而 不 是 主 存储 器 。 这 些 单元 通常 以 寄存 器 的 形式 
组 织 成 位 存储 电路 ( 触发 器 )， 习 惯 上 把 它们 称 
为 IO 寄存 器 (IO register )。 由 于 IO 设备 和 存 
储 器 共享 同一 个 地 址 空间 ， 所 以 这 种 方式 被 称 为 存储 器 映射 IJO ( memory-mapped IO )。 大 多 
数 计算 机 都 使 用 了 这 种 组 织 方式 。 

使 用 存储 器 映射 IO 时 ， 任 何 可 以 访问 存储 器 的 机 器 指令 也 都 可 以 用 来 与 IO 设备 进行 数 
据 传送 。 比 如 ， 如 果 DATAIN 是 输入 设备 中 一 个 寄存 器 的 地 址 ， 那 么 指令 





图 3-1 计算 机 系统 
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Load R2, DATAIN 
将 从 DATAIN 寄存 器 中 读 取 数据 并 将 其 装 入 寄存 器 R2 中 。 类 似 地 ， 指 令 

Store R2, DATAOUT 
将 寄存 器 R2 的 内 容 发 送 到 DATAOUT 单元 中 ，DATAOUT 单元 是 输出 设备 中 的 一 个 寄存 器 。 


3.1.1 1/O 设备 接口 

一 个 W/O 设备 通过 一 个 称 为 设备 接口 ( device interface ) 的 电路 连接 到 互连网 络 中 ， 这 个 
电路 提供 了 便于 数据 传输 和 管理 设备 操作 所 需 的 数据 传输 方法 以 及 状态 和 控制 信息 的 交换 方 
法 。 这 个 接口 包括 一 些 可 以 被 处 理 器 访问 的 寄存 器 ， 一 个 寄存 器 可 作为 数据 传输 的 缓冲 区 ， 另 
一 个 可 以 保存 关于 设备 当前 状态 的 信息 ， 还 有 一 个 则 可 以 存储 控制 设备 操作 行为 的 信息 。 这 些 
数据 (data )、 状 态 (status ) 和 控制 ( control ) 寄存 器 是 通过 程序 指令 来 访问 的 ， 就 好 像 它 们 
是 存储 单元 一 样 。 典 型 的 信息 传输 是 在 IO 寄存 器 和 处 理 器 寄存 器 之 间 发 生 的 - 图 3-2 说 明了 
从 软件 的 角度 来 看 ， 键 盘 和 显示 设备 是 如 何 连接 到 处 理 器 上 的 。 


互连网 络 





图 3-2 处理 器 、 键 盘 和 显示 器 之 间 的 连接 


3.1.2 ”程序 控制 |/O 

让 我 们 从 两 个 基本 的 人 机 交互 IO 设备 一 一 键盘 和 显示 器 开始 讨论 输入 /输出 方面 的 问 
题 。 考 虑 这 样 一 个 任务 : 读 取 键盘 上 键入 的 字符 ， 并 将 这 些 数 据 存 储 在 存储 器 中 ， 然 后 再 在 显 
示 屏 幕 上 显示 这 些 字符 。 实 现 这 个 任务 的 一 种 简单 方法 就 是 写 一 个 程序 ， 让 它 来 执行 实现 所 需 
动作 的 所 有 功能 ， 这 种 方法 被 称 为 程序 控制 UO ( program-controlled IO )。 

除了 把 每 个 字符 从 键盘 传输 到 存储 器 中 然后 再 传输 到 显示 器 之 外 ， 还 需要 保证 这 一 切 都 
要 在 正确 的 时 刻 发 生 。 在 一 个 键 被 按 下 的 时 候 必须 读 取 输 入 的 字符 。 对 于 输出 来 说 ， 只 有 当 显 
示 设 备 能 够 接受 一 个 字符 的 时 候 才 能 将 该 字符 发 送 给 显示 器 。 从 键盘 到 计算 机 的 数据 传输 速度 
是 受用 户 打字 速度 的 限制 的 ， 打 字 速 度 不 可 能 超过 每 秒 几 个 字符 。 而 从 计算 机 到 显示 器 的 输出 
传输 速度 要 高 得 多 ， 输 出 速度 是 由 字符 被 传输 到 显示 设备 并 显示 出 来 的 速度 决定 的 ， 显 示 速 度 
通常 是 每 秒 几 千 个 字符 。 但 是 ， 这 还 是 比 每 秒 可 执行 数 十 亿 条 指令 的 处 理 器 速度 要 慢 得 多 。 这 
种 处 理 器 和 LO 设备 之 间 的 速度 差异 使 得 在 它们 之 间 进 行 数据 传输 需要 有 同步 机 制 的 支持 。 

该 问题 的 一 种 解决 方案 是 利用 信和 号 协议 。 在 输出 时 ， 处 理 器 发 送 第 一 个 字符 ， 然 后 就 等 
待 来 自 于 显示 器 的 表示 可 以 发 送 下 一 个 字符 的 信号 。 然 后 处 理 器 再 发 送 第 二 个 字符 ， 依 次 类 
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推 。 从 键盘 获得 输入 字符 使 用 类 似 的 方法 。 处 理 器 等 待 着 一 个 信号 ， 该 信号 表示 一 个 键 被 按 
下 ， 并 且 相 应 字符 的 二 进 制 码 已 经 保存 在 一 个 与 键盘 相关 联 的 VO 寄存 器 中 ， 然 后 处 理 器 开始 
读 取 该 二 进 制 码 。 

在 一 个 键 被 按 下 的 时 候 ， 键 盘 中 的 一 个 电路 会 对 其 进行 响应 ， 为 对 应 字符 产生 计算 机 所 
使 用 的 代码 。 我 们 假定 计算 机 使 用 的 是 ASCII 码 ( 表 1-1 )， 其 中 每 个 字符 代码 占用 一 个 字 节 。 
令 KBD DATA 表示 一 个 用 于 存放 生成 字符 的 8 位 寄存 器 的 地 址 标签 。 另 外 ,假设 有 一 个 信 
号 ， 可 以 通过 将 一 个 称 为 KIN 的 触发 器 置 为 1 来 表示 一 个 键 被 按 下 ， 其 中 KIN 是 一 个 8 位 状 
态 寄存 器 KBD STATUS 中 的 一 部 分 。 处 理 器 可 以 读 取 状 态 标志 (status flag ) KIN 来 确定 一 个 
字符 代码 是 否 已 被 放置 在 KBD_DATA 内 。 当 处 理 器 读 取 状态 标志 以 确定 其 状态 的 时 候 ， 我 们 
说 处 理 器 正在 轮 询 ( poll ) 该 IO 设备 。 

显示 器 则 包含 一 个 叫做 DISP_DATA 的 8 位 寄存 器 ， 用 于 从 处 理 器 接收 字符 。 而 且 它 还 
必须 能 够 表明 它 已 准备 好 接收 下 一 个 字符 ， 这 可 以 通过 一 个 叫做 DOUT 的 状态 标志 来 完成 ， 
DOUT 是 一 个 状态 寄存 器 DISP_STATUS 中 的 一 位 。 

地 址 





7 6 5 4 3 2 1 0 
wm ton ss 
a ) 键盘 接口 

7 沾 5 放 3 2 1 0 
Ox4014 pouT| |DIRQ| DISP_STATUS 
0x4018 | DIE | | | DISP_CONT 
b ) 显示 器 接口 


图 3-3 键盘 和 显示 器 接口 中 的 寄存 器 


图 3-3 说 明了 这 些 寄存 器 是 如 何 组 织 的 。 每 个 设备 的 接口 中 还 包括 一 个 控制 寄存 器 ， 我 们 
将 在 3.2 节 中 讨论 。 我 们 只 列举 了 寄存 器 中 与 本 章 所 讨论 的 内 容 有 关 的 一 些 位 。 寄 存 器 中 的 其 
他 位 可 以 用 于 其 他 用 途 ， 或 者 可 能 被 简单 地 忽略 掉 

如 果 需 要 像 访 问 存储 单元 一 样 访问 VO 接口 中 的 寄存 器 ， 则 必须 给 每 个 寄存 器 分 配 一 个 能 
被 接口 电路 识别 的 特定 地 址 。 在 图 3-3 中 ， 我 们 分 别 为 键盘 和 显示 器 分 配 了 十 六 进 制 数 4000 
和 4010 作为 其 基本 地 址 ， 这 两 个 数 是 数据 寄存 器 的 地 址 。 状 态 寄 存 器 的 地 址 比 数据 寄存 器 的 
地 址 高 4 个 字 节 ， 控 制 寄 存 器 的 地 址 则 比 数据 寄存 器 的 地 址 高 8 个 字 节 。 这 使 得 一 台 32 位 字 
长 的 计算 机 中 的 所 有 地 址 都 可 以 实现 字 对 齐 ， 在 实际 的 应 用 中 通常 也 是 这 么 做 的 。 以 这 种 方式 
给 寄存 器 分 配 地 址 使 得 在 处 理 器 执行 的 程序 中 可 以 访问 IO 寄存器。 这 也 是 从 程序 员 角 度 所 看 
到 的 设备 。 

我 们 需要 一 个 程序 来 执行 下 面 的 任务 : 读 取 键盘 所 产生 的 字符 ， 并 把 这 些 字 符 存储 在 存储 
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器 中 ， 最 后 将 它们 发 送 到 显示 器 上 。 为 了 执行 IO 传输 ， 处 理 器 必须 执行 检查 状态 标志 和 在 处 
理 器 与 IO 设备 之 间 传 输 数 据 的 机 器 指令 。 

我 们 研究 一 下 输入 过 程 的 细节 。 当 一 个 键 被 按 下 时 ， 键 盘 电路 把 ASCII 编码 的 字符 放 
到 KBD_DATA 寄存 器 中 。 在 同一 时 间 ， 键 盘 电路 将 KIN 标志 设置 为 1。 同时 处 理 器 正在 执 
行 一 个 IO 程序 ， 它 会 不 断 地 检查 KIN 标志 的 状态 。 当 它 检 测 到 KIN 被 设置 为 1 时 ， 它 就 把 
KBD_DATA 的 内 容 传 送 到 一 个 处 理 器 寄存 器 中 。 一 旦 KBD_DATA 的 内 容 被 读 出 ，KIN 就 必 
须 被 清除 为 0， 这 通常 是 由 接口 电路 自动 完成 的 。 如 果 在 键盘 上 输入 第 二 个 字符 ，KIN 再 次 被 
置 成 1， 并 重复 上 述 过 程 。 所 需 的 动作 可 通过 执行 以 下 操作 来 实现 : 

READWAIT 读 取 KIN 标志 
当 KIN = 0 时 转移 到 READWAIT 
将 数据 从 KBD_DATA 传输 到 R5 
这 些 操作 将 字符 读 到 处 理 器 寄存 器 R5 中 。 

当 字符 从 处 理 器 传送 到 显示 器 时 ， 会 发 生 类 似 的 处 理 过 程 。 当 DOUT 等 于 1 时 ， 表 示 显 
示 器 已 经 准备 好 接收 一 个 字符 了 。 在 程序 的 控制 下 ， 处 理 器 监控 DOUT， 并 且 当 DOUT 等 于 
1 时 ， 处 理 器 就 将 一 个 ASCII 编码 字符 传送 到 DISP_DATA 中 。 字 符 被 传送 到 DISP_DATA 后 
DOUT 被 清 为 0。 当 显示 设备 准备 好 接收 第 二 个 字符 时 ，DOUT 再 次 被 置 成 1。 这 可 以 通过 执 
行 以 下 操作 来 实现 : 

WRITEWAIT 读 取 DOUT 标志 
当 DOUT = 0 时 转移 到 WRITEWAIT 
将 数据 从 R5 传输 到 DISP_DATA 
重复 执行 该 等 待 循环 ， 直 到 状态 标志 DOUT 被 显示 器 置 成 1， 这 表示 显示 器 此 时 是 空闲 的 ， 可 
以 接收 一 个 字符 了 。 然 后 R5 中 的 字符 被 传输 到 DISP_DATA 中 准备 显示 ， 这 个 操作 也 将 把 
DOUT 清除 为 0。 

我 们 假设 KIN 的 初始 状态 是 0，DOUT 的 初始 状态 是 1。 在 接 通电 源 的 时 候 ， 通 常 由 设备 
控制 电路 来 执行 这 个 初始 化 操作 。 

在 使 用 存储 器 映射 IO 的 计算 机 中 ， 其 中 一 些 地 址 被 用 来 表示 IO 接口 中 的 寄存 器 ， 这 样 
就 可 以 使 用 像 Load 、Store 和 Move 这 样 的 指令 在 寄存 器 和 处 理 器 之 间 传 输 数 据 。 例 如 ， 用 下 
面 这 条 指令 可 以 将 键盘 字符 缓冲 区 KBD_DATA 中 的 内 容 传送 到 处 理 器 寄存 器 R5 中 : 

LoadByte R5, KBD_ DATA 
类 似 地 ， 使 用 下 面 的 指令 可 以 将 寄存 器 R5 中 的 内 容 传输 到 DISP_DATA 中 : 
StoreByte RS, DISP DAIA 
区 别 于 作用 在 字 操 作 数 上 的 Load 和 Store 操作 码 ，LoadByte 和 StoreByte 操作 码 表示 操作 数 的 
大 小 是 一 个 字 节 。 
上 面 描述 的 读 操 作 可 以 用 如 下 RISC 风格 的 指令 来 实现 : 


READWAIT: LoadByte R4, KBD STATUS 
And R4, R4, #2 
Branch if [R4]=0 READWAIT 
LoadByte R5, KBD DATA 


And 指令 用 来 测试 KIN 标志 ， 也 就 是 从 寄存 器 KBD STATUS 中 读 取 到 R4 中 的 状态 信息 的 位 
bli。 只 要 hh=0,AND 操作 的 结果 就 会 使 得 R4 的 值 等 于 零 ， 该 READWAIT 循环 就 会 继续 执行 。 
同样 ， 写 操作 可 以 用 如 下 指令 实现 : 
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WRITEWAIT: LoadByte R4, DISP_ STATUS 
And R4, R4, #4 
Branch if [R4]=0 WRITEWAIT 
StoreByte RS, DISP_ DAIA 


我 们 可 以 看 到 ， 在 这 种 情况 下 ，And 指令 使 用 立即 值 4 来 测试 显示 器 的 状态 位 b2。 


3.1.3 一 个 RISC 风格 的 I/O 程序 示例 


如 图 3-4 所 示 ， 我 们 现在 有 了 一 个 可 以 执行 典型 的 VO 任务 的 完整 程序 。 该 程序 使 用 了 上 
面 描述 的 程序 控制 IO 的 方法 来 读 取 、 存 储 以 及 显示 在 键盘 上 键入 的 一 行 字符 。 当 字符 一 个 个 
地 被 读 人 时， 它们 被 存储 在 存储 器 中 ， 然 后 回 显 ( echo ) 到 显示 器 上 。 当 遇 到 回 车 符 CR 时 ， 
这 个 程序 结束 。 存 储 器 中 将 要 存储 该 行 字符 的 第 一 个 字 节 单元 的 地 址 是 LOC。 寄 存 器 R2 用 来 
指向 这 一 部 分 的 存储 器 ， 程 序 中 第 一 条 指令 用 地 址 LOC 对 其 进行 了 初始 化 设置 。 每 读 取 和 显 
示 一 个 字符 ，R2 就 递增 一 次 。 


R2, #LOC 初始 化 指针 寄存 器 R2， 使 其 指向 主 存 
中 存储 字符 的 第 一 个 单元 的 地 址 


MoveByte R3, #CR 将 回 车 符 的 ASCII 码 装 和 R3 中 

LoadByte R4, KBD_STATUS 等 待 一 个 字符 的 键入 

And R4, R4, #2 检查 标志 KIN 

Branch_if_[R4]=0 READ 

LoadByte R5, KBD_DATA 从 KBD_DATA 中 读 取 字符 (这 将 把 KIN 
清 为 0) 

StoreByte R5, (R2) 将 字符 写 人 到 主 存 中 并 递增 指向 主 存 的 

Add R2, R2, #1 指针 

LoadByte R4, DISP_STATUS 等 待 显示 器 准备 就 绪 

And R4, R4, #4 检查 DOUT 标志 

Branch_if_[R4]=0 ECHO 

StoreByte R5, DISP_DATA 将 刚 读 入 的 字符 移 到 显示 器 缓冲 寄存 器 
中 (这 将 DOUT 清 为 0) 

Branch_if_[R5]7[R3] READ 检查 刚 读 人 的 字符 是 否 为 回 车 符 ， 如 果 
不 是 ， 则 转移 回去 读 取 另 一 个 字符 





图 3-4 ”一 个 读 取 并 显示 一 行 字符 的 RISC 风格 的 程序 


3.1.4 一 个 CISC 风格 的 MO 程序 示例 


我 们 使 用 CISC 风格 的 指令 来 完成 同样 的 任务 。 在 CISC 指令 集中 我 们 可 以 直接 对 存储 器 

中 的 操作 数 执行 一 些 算术 和 逻辑 运算 。 所 以 可 能 会 有 如 下 的 指令 : 
| TestBit destination, #k 
这 条 指令 测试 目的 操作 数 的 bh 位 ， 如 果 bi=0， 则 将 条 件 标 志 Z ( Zero ) 设置 为 1， 反 之 则 设置 
为 0。 因 为 操作 数 可 以 在 一 个 存储 单元 中 ， 所 以 我 们 可 以 使 用 指令 
TestBit KBD STATUS, #1 

来 测试 键盘 接口 中 KIN 标志 的 状态 。 然 后 可 以 使 用 一 条 能 够 检查 Z 标志 状态 的 Branch ( 转移 ) 
指令 来 跳 转 到 等 待 循环 的 开始 部 分 。 

3-5 给 出 了 一 个 读 取 并 显示 一 行 字 符 的 CISC 风格 的 程序 。 我 们 可 以 看 到 ， 第 一 条 
MoveByte 指令 将 每 个 字符 从 KBD_DATA 直接 传输 到 R2 指向 的 存储 单元 。 一 条 Compare ( 比 
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较 ) 指令 

Compare destination, source 
将 日 的 操作 数 的 内 容 减 去 源 操作 数 的 内 容 来 进行 比较 ， 然 后 根据 比较 的 结果 来 设置 状态 标志 。 
这 个 操作 并 不 会 改变 源 或 者 目的 操作 数 的 内 容 。 注 意图 3-5 中 的 CompareByte 指令 使 用 了 自 
动 增 量 的 寻 址 方式 ， 这 种 寻 址 方式 会 在 比较 操作 结束 后 自动 递增 指针 R2 的 值 。 而 在 图 3-4 中 
RISC 风格 的 程序 中 ， 指 针 必 须 使 用 一 条 单独 的 Add ( 加 法 ) 指令 来 进行 递增 。 


Move R2, #LOC 初始 化 指针 寄存 器 R2， 使 其 指向 主 存 
中 存储 字符 的 第 一 个 单元 的 地 址 


: TestBit KBD_STATUS, #1 等 待 一 个 字符 被 输入 到 键盘 缓冲 区 
Branch=0 READ KBD_DATA 中 
MoveByte (R2), KBD_DATA 将 字符 从 KBD DATA 传送 到 主 存 中 
(这 将 KIN 清 为 0) 


TestBit DISP_STATUS, #2 等 待 显示 器 准备 就 绪 

Branch=0 ECHO 

MoveByte DISP_DATA, (R2) 把 刚 读 人 的 字符 移 到 显示 器 缓冲 寄存 器 
中 (这 将 DOUT 清 为 0) 

CompareByte  (R2)+ , #CR 检查 刚 读 入 的 字符 是 否 为 CR ( 回 车 
符 )， 如 果 不 是 ， 则 转移 回去 读 取 另 一 个 

Branch0 READ 字符 。 同 时 ， 递 增 指 针 以 存储 下 一 个 字符 





图 3-5 ”一 个 读 取 并 显示 一 行 字符 的 CISC 风格 的 程序 


我 们 已 经 讨论 了 在 大 多 数 计算 机 中 所 使 用 的 存储 器 映射 IO 方案 。 在 一 些 处 理 器 中 还 可 以 
找到 一 种 替代 方案 ， 这 些 处 理 器 中 存在 特殊 的 In 和 Out 指令 来 执行 IO 传输 。 在 这 种 情况 下 ， 
存在 一 个 只 被 这 些 指令 使 用 的 单独 的 VO 地 址 空间 。 当 搭建 使 用 这 类 处 理 器 的 计算 机 系统 时 ， 
设计 者 可 以 选择 将 IO 设备 连接 起 来 以 使 用 特殊 的 IO 地 址 空间 ， 或 简单 地 将 它们 整合 为 存储 
带 地 址 空间 的 一 部 分 。 

程序 控制 VO 方式 需要 处 理 器 连续 地 参与 到 IO 活动 中 。 在 图 3-4 和 3-5 的 程序 中 几乎 所 
有 的 执行 时 间 都 花费 在 等 待 一 个 键 被 按 下 或 显示 器 变 为 可 用 的 循环 中 了 。 为 了 避免 处 理 器 的 执 
行 时 间 浪 费 在 这 些 等 待 循环 上 ， 我 们 可 以 使 用 中 断 的 概念 。 


3.2 中断 

在 图 3-4 和 图 3-5 的 例子 中 ， 当 程序 进入 等 待 循环 后 ， 不 停 地 重复 测试 设备 状态 。 这 期 
间 ， 处 理 器 不 进行 任何 有 效 的 计算 。 但 在 很 多 情况 下 ， 处 理 器 在 等 待 IO 设备 就 绪 期 间 可 以 执 
行 其 他 的 任务 。 为 此 ， 我 们 安排 VO 设备 在 准备 就 绪 时 主动 通知 处 理 器 ， 这 可 以 通过 发 送 一 个 
称 为 中 断 请 求 (interrupt request ) 的 硬件 信号 给 处 理 器 来 实现 。 既 然 处理 器 不 再 需要 连续 地 轮 
询 IO 设备 的 状态 ， 那 么 便 可 以 利用 等 待 时 间 来 执行 其 他 有 用 的 任务 。 实 际 上 ， 使 用 中 断 可 以 
很 理想 地 消除 这 些 等 待 时 间 。 
例 3.1 

我 们 来 看 一 项 任务 ， 它 需要 进行 大 量 连 续 的 计算 ， 并 将 结果 在 显示 设备 上 显示 出 来 。 显 
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示 结 果 必 须 每 10 秒 更 新 一 次 。10 秘 的 时 间 间 隔 可 以 由 一 个 简单 的 定时 器 电路 来 确定 ， 该 电路 
产生 一 个 合适 的 信号 。 处 理 器 将 定时 器 电路 作为 一 个 输入 设备 ， 它 产生 可 被 查询 的 信号 。 如 果 
这 通过 轮 询 的 方式 进行 ， 处 理 器 将 大 量 的 时 间 浪 费 在 检查 信号 的 状态 上 。 一 个 更 好 的 解决 方案 
是 让 定时 器 电路 每 10 秒 钟 产生 一 个 中 断 请 求 。 作 为 响应 ， 处 理 器 显示 最 新 的 结果 。 
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该 任务 可 以 使 用 一 个 包括 两 个 子 程序 COMPUTE 和 DISPLAY 的 程序 来 实现 。 处 理 器 连续 
地 执行 COMPUTE 子 程序 。 当 它 从 定时 器 接收 到 中 断 请 求 时 ， 将 暂停 COMPUTE 子 程序 的 执 
行 ， 转 去 执行 将 最 新 结果 发 送 到 显示 设备 的 DISPLAY 子 程序 。DISPLAY 子 程序 完成 后 ， 处 理 
器 恢复 COMPUTE 子 程序 的 执行 。 由 于 将 结果 发 送 到 显示 设备 所 需 的 时 间 与 10 秒 钟 的 时 间 间 
隔 相 比 是 非常 小 的 ， 所 以 实际 上 处 理 器 几乎 所 有 的 时 间 都 花费 在 执行 COMPUTE 子 程序 上 。 

这 个 例子 阐明 了 中 断 的 概念 。 响 应 中 断 请 求 时 执行 的 程序 称 为 中 断 服务 程序 (interrupt- 
service routine )， 该 例子 中 的 DISPLAY 程序 便 是 中 断 服 务 程 序 。 中 断 与 子 程序 调用 十 分 相似 。 
假设 在 执行 图 3-6 中 的 指令 i 时 有 一 个 中 断 请 求 到 达 。 那 么 处 理 器 先 执 行 完 指令 i， 然 后 将 中 
断 服 务 程序 的 第 一 条 指令 地 址 装 入 程序 计数 器 中 。 这 里 ,我 们 不 妨 假设 该 地 址 就 在 处 理 器 中 。 
执行 完 中 断 服务 程序 后 ， 处 理 器 返回 到 指令 itl 处 。 因 此 ， 当 发 生 中 断 时 ， 当 前 PC 的 内 容 指 
向 第 it1 条 指令 ， 这 个 值 必须 暂时 保存 到 一 个 已 知 区 域 中 。 在 中 断 服 务 程 序 结束 后 ， 其 末尾 的 
Return-from-interrupt ( 中 断 返 回 指令 ) 将 从 暂时 的 存储 区 域 取出 存储 的 内 容 并 重新 装 入 PC 中 ， 
处 理 器 便 可 从 第 计 1 条 指令 处 恢复 执行 。 返 回 地 址 (return address ) 必须 被 保存 在 一 个 指定 的 
通用 寄存 器 中 或 者 处 理 器 堆栈 中 。 

应 该 注意 的 是 ， 作 为 中 断 处 理 的 一 部 分 ， 处 理 器 必须 通知 设备 它 的 请 求 已 经 被 识别 ， 使 
得 该 设备 撤销 它 的 中 断 请 求 信号 。 这 可 以 由 一 个 通过 互连网 络 发 送 给 设备 的 专门 的 控制 信号 来 
实现 ， 该 控制 信号 被 称 为 中 断 确 认 (interrupt acknowledge ) 信号 。 另 一 种 方法 是 通过 在 处 理 器 
与 IO 设备 接口 之 间 传 输 数 据 来 达到 相同 的 目的 。 在 中 断 服 务 程序 中 ， 当 执行 访问 设备 接口 的 
状态 或 数据 寄存 器 的 指令 时 ， 也 就 相当 于 通知 该 设备 其 中 断 请 求 已 经 被 识别 了 。 

程序 1 程序 2 
COMPUTE 程序 DISPLAY 程序 


中 断 在 这 里 发 生 一 i 


i+l1 


ee 


图 3-6 使 用 中 断 方式 转移 控制 


从 目前 来 看 ， 对 中 断 程序 的 处 理 和 子 程序 十 分 相似 。 但 需要 注意 的 是 二 者 有 着 重要 的 区 
别 。 子 程序 被 调用 时 执行 的 是 调用 程序 请 求 的 功能 ， 因 此 ， 对 状态 信息 和 寄存 器 内 容 的 潜在 改 
变 是 可 以 预期 的 。 而 中 断 服务 程序 可 能 与 收 到 中 断 请 求 时 正在 执行 的 程序 毫 不 相关 。 因 此 在 开 
始 执行 中 断 服务 程序 之 前 ， 必 须 将 该 中 断 服 务 程序 执行 期 间 可 能 会 改变 的 状态 信息 和 处 理 器 寄 
存 器 的 内 容 都 保存 起 来 。 这 些 保存 的 信息 在 被 中 断 的 程序 重新 开始 执行 前 必须 被 重新 装 和 人 。 这 
样 ， 原 来 的 程序 就 可 以 继续 执行 ， 除 了 时 间 延 迟 以 外 不 受 中 断 的 任何 影响 。 

保存 和 恢复 信息 的 任务 可 以 由 处 理 器 自动 完成 ， 也 可 以 由 程序 指令 完成 。 大 部 分 现代 处 
理 器 只 保存 能 保持 程序 完整 执行 的 最 小 信息 量 。 这 是 因为 保存 和 恢复 寄存 器 的 过 程 中 包括 存储 
器 传递 ， 它 将 增加 总 的 执行 时 间 ， 因 而 增加 执行 开销 。 并 且 ， 保 存 寄 存 器 也 会 增加 从 接收 中 断 
请 求 到 开始 执行 中 断 服务 程序 之 间 的 时 间 延 迟 。 这 一 延迟 被 称 为 中 断 等 待 ( interrupt latency )。 
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在 一 些 应 用 中 ， 过 长 的 中 断 等 待 是 不 可 接受 的 。 所 以 ， 当 收 到 中 断 请 求 时 ， 应 尽量 减少 处 理 器 
自动 保存 的 信息 量 。 通 常 ， 处 理 器 只 保存 程序 计数 器 和 处 理 器 状态 寄存 器 的 内 容 。 任 何 需要 保 
存 的 额外 信息 都 必须 由 显 式 的 指令 在 中 断 服 务 程 序 开始 时 保存 起 来 ， 在 中 断 服 务 程序 结束 时 进 
行 恢复 。 在 一 些 早期 的 处 理 器 中 ， 尤 其 是 在 那些 只 有 很 少 寄存 器 的 处 理 器 中 ， 收 到 中 断 请 求 时 
所 有 寄存 器 都 被 处 理 器 硬件 自动 保存 起 来 。 而 中 断 返 回 指令 的 执行 会 将 这 些 保存 的 数据 恢复 到 
各 自 的 寄存 器 中 。 

有 一 些 计算 机 提供 了 两 种 类 型 的 中 断 ， 其 中 一 种 需要 保存 所 有 寄存 器 的 内 容 ， 而 另 一 种 
不 需要 。 一 个 特定 的 IO 设备 可 以 选择 任何 一 种 类 型 的 中 断 ， 这 取决 于 它 对 响应 时 间 的 要 求 。 
还 有 一 种 方式 是 复制 处 理 器 的 寄存 器 组 。 在 这 种 方式 中 ， 中 断 服务 程序 可 以 使 用 另 一 个 不 同 的 
寄存 器 组 ， 不 需要 保存 和 恢复 寄存 器 。 这 些 重复 的 寄存 器 有 时 候 也 被 称 为 影子 寄存 器 ( shadow 
register )。 

中 断 要 比 简 单 的 程序 控制 能 更 好 地 协调 VO 传输 。 从 一 般 意义 上 说 ， 中 断 能 够 由 计算 机 外 
部 的 事件 引起 控制 权 从 一 个 程序 到 另 一 个 程序 的 转移 。 被 中 断 的 程序 在 中 断 服 务 程序 执行 完 后 
接着 继续 执行 。 在 操作 系统 和 很 多 其 他 控制 应 用 中 都 使 用 了 中 断 的 概念 ， 在 这 些 应 用 中 ， 特 定 
程序 的 运行 必须 与 外 部 事件 严格 同步 ， 这 通常 称 为 实时 处 理 (real-time processing )。 


3.2.1 中 断 的 允许 与 禁止 
计算 机 所 提供 的 设施 必须 使 程序 员 能 够 完全 控制 程序 执行 期 间 发 生 的 事件 。 当 外 部 设备 
的 中 断 请 求 到 达 时 ， 处 理 器 将 中 止 一 个 程序 的 执行 转 而 去 启动 男 一 个 程序 。 由 于 随时 都 可 能 出 


” 现 ， 所 以 中 断 有 可 能 改变 程序 员 预 先 设 定 的 事件 顺序 。 因 此 ， 必 须 间 慎 处 理 程序 执行 中 的 中 


断 。 计 算 机 的 一 个 基本 功能 就 是 能 按照 需要 允许 和 禁止 中 断 。 

在 很 多 情况 下 处 理 器 需要 忽略 中 断 请 求 。 例 如 ， 例 3.1 的 定时 器 电路 ， 只 有 在 COMPUTE 
子 程序 执行 的 时 候 才 能 提出 中 断 请 求 ， 在 其 他 任务 正在 执行 的 时 候 应 当 阻 止 其 发 出 中 断 请 求 。 
在 有 些 情 况 下 ， 可 能 需要 保证 特定 的 指令 序列 没有 中 断 地 执行 下 去 ， 因 为 中 断 服 务 程序 可 能 会 
改变 序列 中 某 些 指令 所 需要 的 数据 。 出 于 这 些 原因 ， 我 们 必须 提供 一 些 允 许 和 禁止 中 断 的 方法 
供 程序 员 使 用 。 

在 处 理 器 和 IO 设备 端 都 可 以 很 方便 地 允许 和 禁止 中 断 。 处 理 器 可 以 接受 或 忽略 中 断 请 
求 ，LO 设备 也 可 以 被 允许 或 被 禁止 提出 中 断 请 求 。 实 现 这 一 点 的 一 种 常用 机 制 是 使 用 一 些 可 
以 被 程序 指令 访问 的 寄存 器 控制 位 。 

处 理 器 中 有 一 个 状态 寄存 器 ( status register PS )， 其 中 包含 有 关 其 当前 操作 状态 的 信息 。 
该 寄存 器 的 一 个 位 IE 被 分 配 用 于 允许 /禁止 中 断 。 然 后 程序 员 可 以 设置 或 清除 IE 位 来 执行 所 
和 需 的 动作 。 当 IE = 1 时 ，LO 设备 的 中 断 请 求 被 处 理 器 接受 并 处 理 。 当 IE= 0 时 ， 处 理 器 就 简 
单 地 忽略 所 有 IO 设备 的 中 断 请 求 。 

LO 设备 的 接口 包括 一 个 控制 寄存 器 ， 其 中 包含 可 以 管理 设备 操作 模式 的 信息 。 该 寄存 器 
的 一 个 位 可 以 专门 用 于 中 断 控制 。 只 有 在 该 位 被 设置 为 1 时 IO 设备 才能 被 允许 发 出 中 断 请 
求 。 我 们 将 在 3.2.3 节 中 讨论 这 个 方法 。 

现在 让 我 们 考虑 只 有 一 台 设备 的 单一 中 断 请 求 的 特殊 情况 。 当 一 台 设 备 激活 中 断 请 求 信 
号 时 ， 它 保持 这 个 信号 直到 确认 处 理 器 已 经 接收 了 该 中 断 请 求 。 这 就 是 说 中 断 请 求 信 号 在 中 断 
服务 程序 执行 期 间 将 保持 有 效 ， 也 许 要 持续 到 访问 该 设备 的 指令 到 达 。 另 一 方面 也 要 保证 这 个 
有 效 的 请 求 信号 不 会 导致 连续 的 中 断 ， 而 使 系统 进入 一 个 无 法 恢复 的 死 循环 。 

一 个 不 错 的 方法 是 使 处 理 器 在 开始 执行 中 断 服务 程序 之 前 自动 禁止 中 断 。 处 理 器 保存 程 
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序 计 数 器 和 处 理 器 状态 寄存 器 的 内 容 。 将 PS 寄存 器 的 内 容 保存 后 ， 此 时 下 位 的 1 也 被 保存 
了 下 来 ， 之 后 处 理 器 将 PS 寄存 器 中 的 IE 位 清 0， 从 而 禁止 新 的 中 断 发生 。 然 后 处 理 器 开始 执 
行 中 断 服务 程序 。 当 执行 中 断 返 回 指令 时 ，PS 寄存 器 恢复 之 前 保存 的 内 容 ， 正 位 被 重 置 为 1。 
这 样 ， 中 断 被 重新 允许 。 

在 继续 学 习 更 复杂 的 中 断 内 容 前 ， 我 们 总 结 一 下 处 理 来 自 单一 设备 的 中 断 请求 时 所 包含 
的 事件 序列 。 假 设 在 处 理 器 和 设备 端 都 是 允许 中 断 的 ， 下 面 是 一 个 一 般 的 过 程 : 

1 ) 设备 发 出 一 个 中 断 请 求 。 

2 ) 处 理 器 中 止 当前 正在 执行 的 程序 并 保存 PC 与 PS 寄存 器 中 的 内 容 。 

3 ) 将 PS 寄存 器 中 的 正 位 清 零 来 禁止 中 断 。 

4) 中 断 服务 程序 执行 中 断 所 请 求 的 操作 。 在 此 期 间 ， 通 知 设备 其 中 断 请 求 已 经 被 识别 ， 
然后 设备 撤销 中 断 请 求 信 号。 

5 ) 中 断 服务 程序 执行 结束 后 , PC 与 PS 寄存 器 恢复 之 前 保存 的 内 容 〈 正 位 随 着 PS 的 恢 
复 也 被 恢复 为 1 而 允许 中 断 )， 被 中 断 的 程序 继续 执行 。 


3.2.2 ”处 理 多 台 设 备 

现在 我 们 考虑 一 个 情况 ， 处 理 器 上 连接 了 多 人 台 能 够 发 出 中 断 请 求 的 设备 。 因 为 在 操作 上 
这 些 设备 是 相互 独立 的 ， 所 以 没有 固定 的 中 断 发 生 顺 序 。 例 如 ， 正 在 处 理 设备 Y 引起 的 中 断 
时 设备 X 可 能 又 发 出 中 断 请 求 ,或 者 几 台 设备 都 刚好 在 同一 时 间 发 出 中 断 请 求 。 这 导致 了 一 
系列 的 问题 : 

1 ) 处 理 器 如 何 确定 哪个 设备 发 出 了 中 断 请 求 ? 

2 ) 如 果 不 同 的 设备 要 求 不 同 的 中 断 服 务 程序 ， 在 每 一 种 情况 下 处 理 器 怎样 获取 适当 的 程 
序 起 始 地 址 ? 

3 ) 当 有 中 断 正在 被 处 理 时 ， 另 一 台 设 备 是 否 可 以 中 断 处 理 器 ? 

4 ) 怎样 处 理 两 个 或 更 多 个 同时 产生 的 中 断 请 求 ? 

不 同 的 计算 机 处 理 这 些 问 题 的 方法 各 不 相同 ， 采 用 何 种 方法 解决 上 述 问 题 对 于 确定 计算 
机 与 特定 应 用 是 否 匹 配 是 非常 重要 的 。 

当 收 到 一 个 中 断 请 求 时 ， 需 要 识别 是 哪 一 台 设 备 发 出 的 中 断 请 求 。 而 且 ， 如 果 有 两 台 设 
备 同时 发 出 中 断 请 求 ， 必 须 选择 其 中 一 个 进行 处 理 。 执 行 完 选中 设备 的 中 断 服务 程序 后 ， 人 处 理 
器 才 可 以 响应 第 二 个 中 断 请 求 。 

读 取 设 备 的 状态 寄存 器 中 的 信息 可 以 确定 一 个 设备 是 否 正在 请 求 中 断 。 当 设备 发 出 中 断 
请 求 后 ， 它 的 状态 寄存 器 中 的 一 位 被 置 成 1， 这 一 位 称 为 IRQ 位 。 最 简单 的 识别 中 断 设备 的 方 
法 就 是 用 中 断 服务 程序 去 轮 询 系统 中 所 有 的 IO 设备 。 查 询 到 的 第 一 个 IRQ 位 被 置 1 的 设备 就 
是 发 出 中 断 请 求 的 设备 ， 然 后 调用 相应 的 处 理子 程序 来 提供 所 请 求 的 服务 。 

轮 询 方式 非常 容易 实现 。 它 的 主要 缺点 是 : 设备 即使 没有 发 出 任何 服务 请 求 ， 系 统 也 要 花 
费时 间 去 检查 其 IRQ 位 。 另 一 种 可 供 选 择 的 方法 是 使 用 向 量 中 断 ， 我 们 将 在 下 面 进行 描述 。 

1， 向量 中 断 

为 了 减少 轮 询 过 程 所 花费 的 时 间 ， 请 求 中 断 的 设备 可 以 直接 向 处 理 器 标明 它 自 己 。 然 后 ， 
处 理 器 就 可 以 立即 开始 执行 相应 的 中 断 服 务 程序 。 术 语 向 量 中 断 〈vectored interrupt ) 指 的 就 是 
基于 这 种 方法 的 中 断 处 理 方式 。 

如 果 请 求 中 断 的 设备 有 它 自 己 的 中 断 请 求 信 号， 就 可 以 利用 中 断 请 求 信号 来 标识 自 疗 ， 
或 者 它 可 以 通过 互连网 络 向 处 理 器 发 送 一 个 专门 的 代码 来 标识 自己 。 处 理 器 的 电路 会 确定 所 请 
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求 的 中 断 服务 程序 的 存储 器 地 址 。 一 个 常用 的 方案 是 在 存储 器 中 永久 地 分 配 一 个 区 域 来 保存 中 
断 服务 程序 的 地 址 。 这 些 地址 通常 被 称 为 中 断 向 量 (interrupt vector )， 而 中 断 向 量 构成 一 个 中 
断 向 量 表 ( interrupt-vector table )。 例 如 ， 可 以 分 配 128 个 字 节 来 保存 一 个 包含 32 个 中 断 向 量 
的 表 。 通 常情 况 下 ， 中 断 向 量 表 会 保存 在 最 低 的 地 址 范围 内 。 中 断 服务 程序 则 可 能 位 于 存储 器 
中 的 任何 位 置 。 当 一 个 中 断 请 求 到 达 时 ， 发 出 请 求 的 设备 所 提供 的 信息 用 来 作为 中 断 向 量 表 中 
的 一 个 指针 ， 相 应 的 中 断 向 量 地 址 会 被 自动 地 加 载 到 程序 计数 器 中 。 

2， 中断 嵌 套 

在 3.2.1 节 中 我 们 提 到 在 执行 中 断 服务 程序 期 间 应 该 禁止 中 断 ， 以 保证 同一 设备 的 中 断 请 
求 不 会 导致 多 次 中 断 。 这 一 方式 还 常用 于 多 台 设 备 的 情况 ， 在 这 种 情况 下 一 个 特定 的 中 断 服 务 
程序 一 旦 开始 执行 ， 处 理 器 就 必须 等 到 该 服务 程序 执行 完毕 才能 接受 第 二 个 设备 的 中 断 请 求 。 
但 中 断 服务 程序 一 般 都 很 短 ， 所 导致 的 延迟 对 于 大 部 分 简单 设备 来 说 都 是 可 以 接受 的 。 

然而 ， 对 于 某 些 设备 ， 响 应 中 断 请 求 时 过 长 的 延迟 将 会 导致 错误 的 操作 。 例 如 ， 有 一 台 
使 用 实时 时 钟 记录 日 常 时 间 的 计算 机 。 实 时 时 钟 在 固定 的 时 间 间 隔 内 向 处 理 器 发 送 中 断 请 求 。 
对 每 一 个 请 求 ， 处 理 器 执行 一 个 简短 的 中 断 服 务 程序 来 增加 存储 器 中 的 一 组 计数 器 ， 这 些 计 数 
器 用 秒 、 分 等 来 记录 时 间 。 正 确 的 操作 要 求 响应 实时 时 钟 中 断 请 求 的 延迟 必须 小 于 两 个 连续 请 
求 之 间 的 时 间 间 隔 。 为 了 确保 在 存在 其 他 中 断 设备 的 情况 下 满足 这 一 条 件 ， 需 要 在 执行 其 他 设 
备 的 中 断 服务 程序 时 接收 时 钟 的 中 断 请 求 。 这 就 是 中 断 肉 套 。 

这 个 例子 表明 IO 设备 需要 按照 一 定 的 优先 级 结构 组 织 起 来 。 在 处 理 低 优先 级 设备 的 中 断 
请 求 时 ， 高 优先 级 设备 的 中 断 请 求 应 该 被 接受 。 

多 优先 级 结构 意味 着 在 执行 一 个 中 断 服务 程序 期 间 ， 一 些 设备 的 中 断 请 求 可 以 被 接受 ， 
而 其 他 一 些 设备 的 请 求 不 可 以 被 接受 ， 这 取决 于 设备 的 优先 级 。 为 了 实现 这 种 方式 ， 我 们 可 以 
给 处 理 器 分 配 一 个 优先 级 ， 它 可 以 在 程序 的 控制 下 改变 。 处 理 器 的 优先 级 就 是 当前 正在 执行 程 
序 的 优先 级 ， 处 理 器 只 接受 优先 级 高 于 它 自 己 的 设备 的 中 断 。 在 某 台 设备 的 中 断 服务 程序 开始 
执行 时 ， 处 理 器 的 优先 级 自动 地 或 者 由 专门 的 指令 提升 为 该 设备 的 优先 级 。 这 一 操作 将 禁止 来 
自 同 一 优先 级 或 较 低 优先 级 设备 的 中 断 ， 而 来 自 更 高 优先 级 设备 的 中 断 请 求 将 继续 被 接受 。 处 
理 器 的 优先 级 可 以 编码 在 处 理 器 状态 寄存 器 的 某 一 些 位 中 。 在 某 些 处 理 器 中 会 使 用 这 种 方法 ， 
在 后 面 的 例子 中 我 们 将 使 用 一 种 更 简单 的 方法 。 

最 后 我 们 需要 指出 ， 如 果 人 允许 艇 套 的 中 断 ， 则 每 一 个 中 断 服务 程序 都 必须 把 程序 计数 器 
和 状态 寄存 器 中 的 内 容 保存 到 堆栈 中 。 这 必须 在 中 断 服务 程序 把 状态 寄存 器 中 的 I 下 位 设置 为 
1 以 允许 笛 套 之 前 完成 。 

3. 同时 请 求 

我 们 还 需要 考虑 两 台 或 多 台 设 备 的 中 断 请 求 同 时 到 达 的 问题 ， 处 理 器 必须 能 够 决定 哪个 
请 求 最 先 被 服务 。 轮 询 VO 设备 的 状态 寄存 器 是 最 简单 的 方法 。 这 种 方式 下 ， 优 先 级 由 轮 询 设 
备 的 顺序 来 决定 。 当 使 用 向 量 中 断 时 ， 必 须 保 证 只 有 一 台 设 备 被 选 定 发 送 它 的 中 断 向 量 代码 。 
这 是 在 硬件 中 通过 使 用 仲裁 电路 来 完成 的 ， 我 们 将 在 第 7 章 中 介绍 仲裁 电路 . 


3.2.3 控制 VO 设备 行为 


确保 中 断 请 求 只 来 自 那些 处 理 器 愿意 处 理 的 IO 设备 是 非常 重要 的 。 因 此 ， 我 们 需要 在 每 
台 设 备 的 接口 电路 中 建立 一 种 机 制 ， 来 控制 该 设备 是 否 允 许 中 断 处 理 器 。 这 一 控制 在 设备 的 接 
口 电路 中 通常 以 中 断 允 许 位 ( interrupt-enable，IE ) 的 形式 提供 。 

IO 设备 的 复杂 性 各 不 相同 ， 从 简单 到 复杂 。 简 单 的 设备 ， 如 键盘 ， 只 需要 很 少 的 控制 。 
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复杂 的 设备 可 能 有 很 多 种 可 能 的 操作 模式 需要 进行 控制 。 一 种 常用 的 方法 是 在 设备 接口 中 提供 
一 个 控制 寄存 器 ， 其 中 包含 控制 设备 行为 所 需 的 信息 。 就 像 我 们 之 前 讨论 过 的 数据 寄存 器 和 状 
态 寄 存 器 一 样 ， 该 寄存 器 也 作为 一 个 可 寻 址 的 单元 进行 访问 。 寄 存 器 中 的 一 位 作为 中 断 允 许 位 
IE。 当 中 断 允 许 位 被 一 条 将 新 信息 写 到 控制 寄存 器 的 指令 置 为 1 时 ， 只 要 该 设备 已 为 IO 传输 
做 好 准备 它 就 可 以 随时 中 断 处 理 器 。 

图 3-3 展示 了 在 键盘 和 显示 设备 的 接口 中 使 用 的 寄存 器 。 由 于 这 些 设备 传输 基于 字符 的 数 
据 ， 每 次 只 处 理 一 个 字符 ， 所 以 在 这 里 使 用 8 位 的 数据 寄存 器 是 合适 的 。 我 们 假定 状态 寄存 器 
和 控制 寄存 器 的 长 度 也 是 8 位 的 。 这 些 寄存 器 中 只 需要 一 位 或 两 位 来 处 理 IO 传输 。 剩 余 的 位 
可 以 用 来 指定 设备 操作 的 其 他 方面 ， 如 果 不 需 要 的 话 就 可 以 忽略 掉 。 键 盘 状 态 寄存 器 包括 KIN 
位 和 KIRQ 位 。 我 们 已 经 在 3.1.2 节 中 讨论 了 KIN 位 的 用 途 。 如 果 中 断 请 求 已 经 发 出 但 尚未 被 
处 理 ， 则 KIRQ 位 被 置 为 1。 只 有 当 其 控制 寄存 器 中 的 中 断 允 许 位 KIE 被 置 为 1 时 ， 键 盘 才 可 
以 发 出 中 断 请 求 。 因 此 ， 当 KIE 位 与 KIN 位 都 等 于 1 时 ， 键 盘 发 出 中 断 请 求 ， 并 且 KIRQ 位 
被 置 为 1。 同 样 ， 显 示 器 接口 的 状态 寄存 器 中 的 DIRQ 位 可 以 表示 显示 器 是 否 已 经 发 出 中 断 请 
求 。 该 接口 的 控制 寄存 器 中 的 DIE 位 用 来 表示 是 否 允许 中 断 。 可 以 观察 到 我 们 已 经 把 KIN 位 
和 KIE 位 放置 在 位 位 置 1 上 ,把 DOUT 和 DIE 位 放置 在 位 位 置 2 上。 这 种 设置 不 是 绝对 的 ， 
只 是 为 了 使 接 下 来 的 程序 实例 更 容易 理解 。 


3.2.4 “处理 器 控制 寄存 器 

我 们 已 经 讨论 了 处 理 器 中 设置 状态 寄存 器 的 必要 性 。 为 了 处 理 中 断 ， 引 入 一 些 其 他 的 控 
制 寄 存 器 是 非常 有 用 的 。 图 3-7 描述 了 一 种 可 能 的 方案 ,其 中 有 4 个 处 理 器 控制 寄存 器 。 状 态 
寄存 器 PS 中 包含 中 断 允许 位 下 ， 除 此 之 外 还 有 一 些 其 他 的 状态 信息 。 只 有 当 焉 位 被 置 为 1 
时 ,处理 器 才能 接受 中 断 。 当 收 到 一 个 中 断 请 求 并 接受 该 请 求 时 ，IPS 寄存 器 将 自动 保存 PS 
的 内 容 。 在 中 断 服务 程序 结束 时 ， 通 过 把 IPS 的 内 容 传输 到 PS 中 ， 人 处 理 器 就 会 自动 恢复 为 以 
前 的 状态 。 由 于 只 有 一 个 寄存 器 被 用 于 存储 以 前 的 状态 信息 ， 所 以 ， 如 果 人 允许 中 断 冬 套 的 话 ， 
那么 在 堆栈 中 保存 IPS 的 内 容 将 会 变 得 很 有 必要 。 
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图 3-7 处 理 器 中 的 控制 寄存 器 


IENABLE 寄存 器 可 以 使 处 理 器 有 选择 地 响应 每 个 IO 设备 。 可 以 在 IENABLE 寄存 器 中 
为 每 个 设备 分 配 一 位 ， 如 图 中 所 示 的 为 键盘 、 显 示 器 以 及 我 们 将 在 后 面 的 例子 中 使 用 的 定时 器 
电路 各 分 配 了 一 位 。 当 某 位 被 置 为 1 时 ， 处 理 器 将 接受 所 对 应 设备 的 中 断 请 求 。IPENDING 寄 
存 器 指示 活跃 的 中 断 请 求 。 当 多 个 设备 同时 发 出 请 求 时 这 将 是 非常 方便 的 。 然 后 ， 程 序 可 以 决 
定 哪 个 中 断 应 该 首先 被 服务 。 
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在 一 个 32 位 的 处 理 器 中 ， 控 制 寄存 器 的 长 度 为 32 位 。 使 用 图 3-7 中 的 结构 ， 将 可 以 用 一 
种 直接 的 方式 来 表示 32 个 IO 设备 。 

汇编 语言 指令 可 以 用 图 3-7 中 那样 的 名 字 来 使 用 处 理 器 控制 寄存 器 。 但 是 不 能 使 用 访问 通 
用 寄存 器 的 方式 来 访问 这 些 寄 存 器 。 它 们 不 能 被 算术 和 逻辑 指令 访问 ， 也 不 能 被 使 用 图 2-32c 
所 示 编 码 格式 的 Load 和 Store 指令 访问 ， 因 为 在 这 些 指令 中 用 一 个 5 位 的 字段 来 指定 源 寄存 
器 或 目的 寄存 器 ， 这 使 得 它 只 能 够 指定 32 个 通用 寄存 器 。 可 以 提供 专门 的 指令 或 专门 的 寻 址 
方式 来 访问 处 理 器 控制 寄存 器 。 在 RISC 风格 的 处 理 器 中 ,专门 的 指令 可 以 是 如 下 类 型 的 

MoveControl  R2, PS 
这 个 指令 把 程序 状态 寄存 器 的 内 容 装 入 寄存 器 R2 中 ， 而 指令 
MoveControl IENABLE, R3 

则 把 R3 的 内 容 放 人 IENABLE 寄存 器 中 。 这 些 指令 完成 控制 寄存 器 与 通用 寄存 器 之 间 的 数据 
传输 操作 。 


3.2.5 ”中 断 程 序 示例 


我 们 已 经 描述 了 中 断 的 基本 知识 ， 现 在 给 出 一 些 说 明 性 的 例子 。 我 们 将 使 用 具有 图 3-3 所 
示 寄 存 器 结构 的 键盘 和 显示 设备 来 展示 这 些 例 子 。 

我 们 再 来 看 一 下 这 个 任务 : 读 取 键盘 上 键入 的 一 行 字 符 ， 并 把 字符 存储 在 主 存 中 ， 然 后 在 
显示 设备 上 显示 这 些 字符 。 在 图 3-4 和 3-5 中 ,我们 使 用 轮 询 法 来 检测 IO 设备 是 否 做 好 数据 
传输 的 准备 ， 以 此 来 展示 这 个 任务 是 如 何 执行 的 。 现 在 ， 我 们 将 对 键盘 使 用 中 断 方式 ， 而 对 显 
示 器 使 用 轮 询 方式 。 

现在 假设 一 个 特定 的 存储 单元 ILOC 专门 用 于 处 理 中 断 ， 并 假设 它 包含 了 中 断 服务 程序 的 
第 一 条 指令 。 每 当 一 个 中 断 请 求 到 达 处 理 器 ， 并 且 处 理 器 中 断 被 允许 时 ， 处 理 器 将 自动 完成 以 
下 工作 : 

e 将 程序 计数 器 的 内 容 存储 在 用 于 保存 返回 地 址 的 处 理 器 寄存 器 中 或 者 存储 在 处 理 器 堆 

栈 中 。 

e 将 状态 寄存 器 PS 的 内 容 转 移 到 IPS 寄存 器 中 保存 起 来 ， 并 清除 PS 中 的 IE 位 。 

e 将 地 址 ILOC 装 入 程序 计数 器 中 。 

假设 我 们 希望 在 主 程序 中 从 键盘 读 取 一 行 字 符 ， 并 存储 到 存储 器 中 从 LINE 单元 开始 的 连 
续 字 节 区 域 中 。 另 外 ， 假 设 中 断 服务 程序 已 经 装 人 存储 器 中 从 ILOC 单元 开始 的 区 域 中 。 则 主 
程序 必须 按 如 下 步骤 来 初始 化 中 断 过 程 : 

1 ) 将 地 址 LINE 装 入 存储 单元 PNTR 中 。 中 断 服 务 程序 把 该 单元 作为 一 个 指针 来 将 输入 
字符 存储 到 存储 器 中 。 

2 ) 通过 将 KBD_CONT 寄存 器 中 的 KIE 位 置 1， 以 允许 键盘 中 断 。 

3 ) 通过 将 控制 寄存 器 IENABLE 中 的 KBD 位置 1， 以 使 处 理 器 能 够 接受 键盘 中 断 。 

4 ) 通过 将 处 理 器 状态 寄存 器 PS 中 的 正 位 置 1， 以 使 处 理 器 能 够 响应 中 断 。 

该 初始 化 过 程 完 成 后 ， 从 键盘 输入 一 个 字符 就 会 导致 键盘 接口 产生 一 个 中 断 请 求 。 此 时 正 
在 执行 的 程序 将 被 中 断 ， 转 去 执行 键盘 输入 中 断 服 务 程序 。 该 中 断 服 务 程序 必须 执行 以 下 任务 : 

1 ) 从 键盘 的 输入 数据 寄存 器 中 读 取 输入 字符 。 然 后 ， 键 盘 接 口 电路 撤销 中 断 请 求 。 

2 ) 将 字符 存储 到 PNTR 指向 的 存储 单元 中 ， 并 递增 PNTR。 

3 ) 使 用 轮 询 方式 显示 该 字符 。 

4 ) 当 达 到 行 尾 时 ， 禁 止 键盘 中 断 并 通知 主 程序 。 
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5 ) 从 中 断 返 回 。 
执行 这 些 任务 的 RISC 风格 的 程序 如 图 3-8 所 示 。 程 序 中 的 注释 已 经 解释 了 相关 的 细节 。 
当 检 测 到 输入 行 的 末端 时 ， 中 断 服 务 程 序 将 KBD_CONT 寄存 器 中 的 KIE 位 清除 ， 表 示 不 期 望 
更 多 的 输入 了 。 同 时 也 将 变量 EOL ( End Of Line ) 置 为 1， 它 在 初始 时 被 清 为 0。 假 设 主 程序 
用 周期 性 的 查询 来 确定 输入 行 是 否 准备 好 进行 处 理 。EOL 变量 提供 了 一 种 在 主 程序 和 中 断 服 
务 程序 之 间 发 送信 号 的 方法 。 
中 断 服务 程序 


ILOC: Subtract SP SP #8 保存 寄存 器 
Store R2, 4(SP) 
Store R3, (SP) 
Load R2, PNTR 载 人 地 址 指针 
LoadByte R3, KBD_DATA 从 键盘 读 人 字符 
StoreByte R3, (R2) 将 字符 写 人 存储 器 
Add R2, R2, #1 递增 指针 
Store R2, PNTR 更 新 存储 器 中 的 指针 
LoadByte R2, DISP_STATUS 等 待 显示 器 准备 就 绪 
And R2, R2, #4 
Branch_if_[R2]=0 ECHO 
StoreByte R3, DISP_DATA 显示 刚 读 人 的 字符 
Move R2, #CR 回 车 符 的 ASCII 码 
Branch_if_[R3][R2] RTRN 如 果 不 是 CR， 则 返回 
Move R2, #1 
Store R2, EOL 指示 行 的 结束 
Clear R2 禁止 键盘 中 断 
StoreByte R2,KBD_CONT 
Load R3, (SP) 恢复 寄存 器 
Load R2, 4(SP) 
Add SP SP #8 
Return-from-interrupt 


Move R2,#LINE 

Store R2, PNTR 初始 化 缓冲 区 指针 

Clear R2 

Store R2, EOL 清除 行 结束 指示 变量 
Move R2, #2 允许 键盘 中 断 

StoreByte R2, KBD_CONT 

MoveControl R2, IENABLE 

Or R2, R2, #2 在 处 理 器 控制 寄存 器 中 允许 
MoveControl IENABLE, R2 键盘 中 断 

MoveControl R2, PS 

Or R2, R2, #1 

MoveControl PS, R2 设置 PS 中 的 中 断 允 许 位 
next instruction 





图 3-8 一 个 使 用 中 断 方式 读 取 一 行 字符 ， 并 使 用 轮 询 方式 显示 该 行 字符 的 RISC 风格 的 程序 


观察 可 知 主 程序 的 最 后 三 条 指令 被 用 来 将 PS 中 的 中 断 允 许 位 置 1。 由 于 只 有 
MoveControl 指令 可 以 访问 控制 寄存 器 的 内 容 ， 所 以 PS 的 内 容 被 装 人 通用 寄存 器 R2 中 ， 修 改 
后 又 写 回 到 PS 中 。 使 用 Or 指令 修改 内 容 只 会 影响 下 位 ， 而 PS 中 的 其 余 位 则 保持 不 变 。 

当 多 个 IO 设备 提出 中 断 请 求 时 ， 需 要 确定 是 哪个 设备 请 求 了 中 断 。 这 可 以 通过 使 用 软件 
去 检查 IPENDING 控制 寄存 器 中 的 信息 ， 并 选择 应 执行 的 中 断 服 务 程序 来 实现 。 

在 例 3.2 中 ,我 们 只 对 键盘 使 用 了 中 断 方式 ， 但 显示 设备 也 可 以 使 用 中 断 方式 。 假 设 一 个 
程序 需要 显示 存储 在 存储 器 中 的 一 页 文本 。 这 可 以 通过 如 下 的 方式 来 完成 : 当 显 示 器 接口 通过 
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一 个 中 断 请 求 来 表示 它 已 准备 就 绪 时 处 理 器 就 发 送 一 个 字符 。 假 设 该 程序 使 用 显示 器 和 键盘 ， 
并 且 人 允许 两 者 发 出 中 断 请 求 。 使 用 图 3-3 和 3-7 中 的 寄存 器 结构 ， 中 断 的 初始 化 和 中 断 请 求 的 
处 理 都 可 以 用 图 3-9 所 示 的 方法 来 完成 。 


中 断 处 理 程序 


ILOC: Subtract SP, SP #12 
Store LINK_reg, 8(SP) 
Store R2, 4(SP) 
Store R3, (SP) 
MoveControl R2, IPENDING 检查 IPENDING 的 内 容 
And R3, R2, #4 检查 显示 器 是 任 发 出 请 求 
Branch_if_[R3]=0 TESTKBD 如 果 没 有 ， 则 检查 键盘 是 否 发 出 请 求 
Call DISR 调用 显示 器 中 断 服务 程序 (ISR ) 
TESTKBD: And R3, R2, #2 检查 键盘 是 否 发 出 请 求 
Branch_if_[R3]=0 NEXT 如 果 没 有 ， 则 检查 下 一 个 设备 
Call KISR 调用 键盘 中 断 服务 程序 ( ISR ) 
检查 其 他 中 断 
Load R3, (SP) 恢复 寄存 器 
Load R2, 4(SP) 
Load LINK_reg:8(SP) 
Add SP, SP, #12 
Return-from-interrupt 


NEXT: 


EE 为 ISR 建立 参数 表 
Move R2, #2 允许 键盘 中 断 
StoreByte R2, KBD_CONT ”允许 显示 器 中 断 
Move R2, #4 
StoreByte R2, DISP_CONT 


MoveControl R2, IENABLE 

Or R2, R2, #6 在 处 理 器 控制 寄存 器 中 允许 中 断 
MoveControl IENABLE, R2 

MoveControl R2, PS 

Or R2, R2, #1 

MoveControl PS, R2 设置 PS 中 的 中 断 允许 位 
下 一 条 指令 


键盘 中 断 服务 程序 
KISR: 
Return 
显示 器 中 断 服务 程序 
DISR: i 


Return 


图 3-9 ”一 个 初始 化 并 处 理 中 断 的 RISC 风格 的 程序 


主 程序 必须 初始 化 中 断 服务 程序 所 需 的 任何 变量 ， 如 存储 器 缓冲 区 指针 。 然 后 主 程序 允 
许 键盘 和 显示 器 中 断 。 接 下 来 主 程序 在 处 理 器 控制 寄存 器 IENABLE 中 允许 中 断 。 注 意 ， 装 和 人 
这 个 寄存 器 的 立即 值 6 将 KBD 和 DISP 位 都 置 为 1。 最 后 通过 将 处 理 器 状态 寄存 器 PS 中 的 下 
位 置 为 1， 使 处 理 器 能 够 响应 中 断 。 

我 们 再 假设 当 一 个 中 断 请 求 到 达 时 ， 处 理 器 将 自动 保存 程序 计数 器 (PC ) 的 内 容 ， 然 后 
将 地 址 ILOC 装 入 PC 中 。 它 同时 也 将 把 状态 寄存 器 (PS ) 中 的 内 容 转 移 到 IPS 寄存 器 中 保 
存 起 来 ， 并 禁止 中 断 。 与 只 有 一 个 设备 能 够 提出 中 断 请 求 的 例 3.2 不 同 ， 现 在 我 们 不 能 直接 
进入 所 需 的 中 断 服务 程序 。 首 先 ， 需 要 确定 发 出 中 断 的 设备 。 我 们 可 以 在 处 理 器 控制 寄存 器 
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IPENDING 中 找到 所 需要 的 信息 。 由 于 中 断 服务 程序 在 这 个 过 程 中 使 用 寄存 器 R2 和 R3， 所 以 
这 两 个 寄存 器 的 内 容 必须 被 保存 在 堆栈 中 以 便 以 后 能 够 恢复 。 子 程序 链接 寄存 器 LINK reg 的 
内 容 也 需要 保存 ， 因 为 当 某 个 子 程序 正在 执行 时 可 能 会 发 生 一 个 中 断 ， 而 该 中 断 的 中 断 服 务 程 
序 可 能 调用 另 一 个 子 程序 。 检 测 中 断 的 电路 将 IPENDING 中 与 每 一 个 待 处 理 的 请 求 相对 应 的 
位 置 为 1。 在 图 3-9 中 ，IPENDING 的 内 容 被 装 和 通用 寄存 器 R2 中 ， 然 后 再 检查 它 来 确定 哪 
些 中 断 正 在 等 待 处 理 。 如 果 显 示 器 有 一 个 待 处 理 的 中 断 ， 那么 它 的 中 断 服务 程序 将 被 执行 。 如 
果 没 有 ， 则 再 检查 键盘 。 接 下 来 可 能 还 将 检查 任何 可 能 有 待 处 理 请 求 的 其 他 设备 。 在 同时 请 求 
的 情况 下 ，IPENDING 中 的 位 的 检查 顺序 ， 确 立 了 中 断 设 备 的 优先 级 。 

处 理 中 断 请 求 并 为 提出 请 求 的 设备 提供 相应 服务 的 程序 通常 称 为 中 断 处理 程 序 (interrupt 
handler )。 注 意 ， 当 中 断 处 理 程序 在 一 个 固定 的 地 址 ILOC 处 开始 时 ， 单 独 的 中 断 服务 程序 就 
只 是 可 以 放 在 存储 器 中 任意 位 置 的 子 程序 而 已 

在 图 3-9 中 ， 我 们 使 用 软件 的 方法 来 确定 发 出 中 断 请 求 的 设备 。 在 使 用 向 量 中 断 的 处 理 器 
中 ， 检 测 中 断 请 求 的 电路 会 为 每 一 个 在 中 断 向 量 表 中 分 配 了 具体 位 置 的 中 断 自动 加 载 一 个 不 同 
的 地 址 到 程序 计数 器 中 。 对 于 每 个 待 处 理 的 请 求 ， 会 有 一 个 单独 的 中 断 服务 程序 一 直 执 行 到 结 
束 ， 即 使 有 多 个 中 断 请 求 在 同一 时 间 提 出 。 

CISC 风格 的 中 断 示例 

使 用 与 前 面 类 似 方法 的 CISC 风格 的 指令 也 可 以 实现 上 述 任务 。 主 要 区 别 在 于 某 些 操作 ， 
如 测试 VO 寄存 器 中 的 某 个 位 ， 可 以 直接 执行 。 例 3.2 和 例 3.3 中 的 任务 可 分 别 用 图 3-10 和 
图 3-11 中 的 程序 实现 。TestBit 指令 用 来 测试 状态 标志 。SetBit 和 ClearBit 指令 分 别 用 来 将 IO 
寄存 器 中 的 某 位 置 为 1 或 0。 程序 中 的 注释 解释 了 如 何 实 现 所 需 的 任务 。 

计算 机 系统 中 所 包含 的 输入 /输出 操作 通常 要 比 这 些 简单 例子 中 的 多 得 多 。 正 如 我 们 将 在 
第 4 章 中 描述 的 ,计算机 操作 系统 将 代表 用 户 程 序 执行 这 些 操作 。 在 第 7 章 中 ， 我 们 将 详细 讨 
论 IO 操作 中 所 使 用 的 硬件 。 


中 断 服务 程序 


ILOC: Move —(SP), R2 ee 
Move R2, PNTR 载 人 地 
MoveByte (R2),KBD_DATA ”将 字符 牛 大 存 依 吕 并 地 增 指 针 
Add PNTR, #1 
TestBit DISP_STATUS, 提 ”等 待 显示 器 准备 就 绪 
Branch=0 ECHO 
MoveByte DISP_DATA, (R2) ”显示 刚 读 人 的 字符 
CompareByte  (R2), #CR 检查 刚 读 和 人 的 字符 是 否 为 回 车 符 (CR ) 
Branch 尖 0 RTRN 如 果 不 是 CR 则 返回 
Move EOL, #1 指示 行 的 结束 
ClearBit KBD_CONT, #1 禁止 键盘 中 断 
Move R2, (SP)+ 恢复 寄存 器 


Return-from-interrupt 


: Move PNTR, #LINE 初始 化 缓冲 区 指针 
Clear 清除 行 结 人 
SetBit 时 允许 键盘 中 
Move ee 
MoveControl 
MoveControl 
Or l 
MoveControl 设置 PS 中 的 中 断 允 许 位 
下 一 条 指令 


图 3-10 ”使 用 中 断 方式 读 取 一 行 字符 并 使 用 轮 询 方式 显示 该 行 字符 的 CISC 风格 的 程序 
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中 断 处 理 程序 
Move 一 (SP), R2 保存 寄存 器 
Move —(SP), LINK_reg 。 
MoveControl « R2, IPENDING 检查 IPENDING 的 内 容 
TestBit R2, #2 检查 显示 器 是 否 发 出 请 求 
Branch=0 TESTKBD 如 果 没 有 ， 则 检查 键盘 是 否 发 出 请 求 
Call DISR 调用 显示 器 的 中 断 服务 程序 (ISR ) 
TestBit R2, #1 检查 键盘 是 否 发 出 请 求 
Branch=0 NEXT 如 果 没 有 ， 则 检查 下 一 个 设备 
Call KISR 调用 键盘 的 中 断 服务 程序 ( ISR ) 
pe 检查 其 他 中 断 


Move LINK_reg, (SP)+ 恢复 寄存 器 
Move R2, (SP)+ 
Return-from-interrupt 


i 为 ISR 建立 参数 表 

SetBit KBD_CONT, #1 允许 键盘 中 断 

SetBit DISP_CONT., #2 允许 显示 器 中 断 

MoveControl  R2, IENABLE 

Or 在 处 理 器 控制 寄存 器 中 允许 中 断 
MoveControl 

MoveControl 

Or 


MoveControl 设置 PS 中 的 中 断 允 许 位 
下 一 条 指令 

键盘 中 断 服务 程序 

KISR: 


Return 


显示 器 中 断 服务 程 
DISR: i 


Return 





图 3-11 初始 化 并 处 理 中 断 的 CISC 风格 的 程序 


3.2.6 ”异常 


中 断 是 导致 一 个 程序 的 执行 被 中 止 、 另 一 个 程序 的 执行 开始 的 事件 。 到 目前 为 止 ， 我 们 
处 理 的 中 断 只 是 由 那些 与 VO 数据 传输 有 关 的 事件 引起 的 。 然 而 ， 中 断 机 制 还 可 以 用 在 许多 其 
他 的 情形 下 。 

术语 异常 (exception ) 通常 用 来 指 任 何 引 起 中 断 的 事件 。 因 此 ，1/O 中 断 是 异常 的 一 种 。 
现在 我 们 来 讲述 几 种 其 他 类 型 的 异常 。 

1. 错误 恢复 

计算 机 使 用 大 量 的 技术 来 确保 所 有 硬件 都 能 正确 工作 。 例 如 ， 许 多 计算 机 在 主 存 中 都 包 
含有 错误 校 验 码 ， 它 可 以 对 存储 的 数据 进行 错误 检测 。 如 果 出 现 了 错误 ， 控 制 硬件 就 会 检测 到 
并 产生 中 断 通知 处 理 器 。 

当 处 理 器 正在 执行 某 个 程序 的 指令 时 ， 如 果 检 测 到 错误 或 不 正常 的 情况 ， 它 也 会 中 断 该 
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程序 。 例 如 ， 一 条 指令 的 OP 码 字 段 有 可 能 不 对 应 任何 合法 指令 ， 或 一 条 算术 指令 试图 除 以 0。 

当 这 些 错误 引发 异常 时 ， 处 理 器 按照 与 处 理 IO 中 断 请 求 相 同 的 方式 进行 处 理 ， 中 止 正在 
执行 的 程序 并 启动 异常 服务 程序 ， 该 异常 服务 程序 进行 适当 的 操作 ， 尽 可 能 从 错误 中 恢复 过 
来 ， 或 将 该 错误 通知 给 用 户 。 回 想 一 下 IO 中 断 时 的 情形 ， 我 们 假设 处 理 咒 在 接受 中 断 前 必须 
完成 正在 执行 的 指令 。 然 而 ， 当 中 断 是 由 与 当前 指令 有 关 的 错误 引起 的 时 候 ， 通 常 不 等 那 条 指 
令 执 行 完 ， 处 理 器 就 立即 开始 异常 处 理 。 

2. 调试 | 

男 一 种 非常 重要 的 异常 是 用 于 帮助 调试 程序 的 。 系 统 软 件 通常 包括 一 个 调试 器 
( debugger ) 程序 ， 它 用 来 帮助 程序 员 找 出 程序 中 的 错误 。 调 试 器 使 用 异常 来 提供 两 项 重要 的 
功能 : 跟踪 模式 和 断 点 。 这 些 功能 将 在 第 4 章 中 详细 描述 。 

3， 异常 在 操作 系统 中 的 使 用 

操作 系统 ( OS ) 软件 的 职责 是 协调 计算 机 内 部 的 活动 。 它 使 用 异常 来 与 用 户 程序 通信 并 
控制 用 户 程序 的 执行 ， 使 用 硬件 中 断 来 执行 IO 操作 。 这 部 分 内 容 将 在 第 4 章 中 进行 讨论 。 


3.3 ”结束 语 


在 这 一 章 中 ， 我 们 讨论 了 两 种 基本 的 IO 传输 方式 。 最 简单 的 技术 是 程序 控制 TO， 在 这 
种 技术 中 ， 处 理 器 在 程序 指令 的 直接 控制 下 执行 所 有 必要 的 功能 。 第 二 种 方式 是 基于 中 断 
的 ， 这 种 机 制 可 以 中 断 程 序 的 正常 执行 ， 转 去 服务 需要 迫切 关注 的 、 具 有 更 高 优先 级 的 请 
求 。 虽 然 所 有 的 计算 机 都 有 处 理 这 种 情况 的 机 制 ， 但 是 不 同 计 算 机 的 中 断 处 理 方 案 的 复杂 程 
度 各 不 相同 。 

我 们 是 从 程序 员 的 角度 来 处 理 IO 问题 的 。 在 第 7 章 中 ， 我 们 将 介绍 硬件 方面 的 内 容 以 及 
一 些 常 用 的 IO 标准 。 


3.4 ”问题 解析 
本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 实例 ， 并 分 析 说 明 如 何 解 决 这 样 的 问题 。 
问题 : 假定 一 个 存储 单元 BINARY 包含 一 个 32 位 的 模式 。 要 求 在 具有 图 3-3 所 示 接 口 的 显示 设备 
上 把 这 些 位 显示 为 8 个 十 六 进 制 数字 。 写 一 个 程序 完成 这 个 任务 。 
解答 : 首先 ， 需 要 把 32 位 的 模式 转换 成 可 表示 为 ASCII 编码 字符 的 十 六 进 制 数字 。 一 个 简单 的 转 
换 方 法 是 使 用 查 表 (table-lookup ) 法 。 建 立 一 个 包含 16 个 表 项 的 表 ， 为 每 一 个 可 能 的 16 进 制 数字 提供 
ASCII 码 。 然 后 ， 我 们 将 BINARY 中 的 模式 分 成 4 位 一 组 的 段 ， 可 以 在 表 中 查 出 相应 的 字符 ， 并 将 其 存 
储 在 从 HEX 单元 开始 的 存储 器 字 节 块 中 。 最 后 ， 将 从 HEX 开始 的 8 个 字符 发 送 给 显示 器 。 
图 3-12 和 图 3-13 分 别 给 出 了 完成 所 需 任 务 的 RISC 风格 和 CISC 风格 的 程序 。 程 序 中 的 注释 详细 描 
述 了 每 行 代码 的 行为 。 
问题 : 思考 例 3.1 中 描述 的 任务 。 假 设 定时 器 电路 包括 一 个 32 位 的 向 上 /向 下 计数 器 ， 它 由 
100MHz 的 时 钟 驱 动 。 该 计数 器 可 以 设 定 为 从 一 个 特定 的 初始 计数 值 开 始 计数 。 定 时 器 的 IO 接口 如 图 
3-14 所 示 ， 其 中 包括 4 个 寄存 器 。 
e TIM_STATUS 指示 定时 器 当前 的 状态 ， 其 中 : 
昌 当 计数 器 运行 时 TON 位 被 置 为 1。 
四 当 计数 器 达到 零 时 ZERO 位 被 置 为 1。 
昌 当 计 数 器 内 容 达到 零 而 且 定时 器 中 断 被 允许 时 ， 定 时 器 发 出 中 断 请 求 ， 此 时 , TIRQ 位 被 置 为 1。 
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DISPLAY: 


DLOOP: 


DISPLAY: 


DLOOP: 
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Load R2, BINARY 载 和 人 二进制 数 
Move R3, #8 R3 是 一 个 被 设置 为 8 的 数字 计数 器 
Move R4, #HEX R4 指向 十 六 进 制 数字 
RotateL R2, R2, #4 把 高 位 数字 循环 移 位 到 低位 
And RS5, R2, #0xF 提取 下 一 个 数字 
LoadByte R6, TABLE(R5) 获取 数字 的 ASCII 码 
StoreByte R6, (R4) 将 其 存储 在 HEX 单元 中 
Subtract R3, R3, #1 递减 数字 计数 器 
Add R4, R4, #1 递增 指向 十 六 进 制 数字 的 指针 
Branch_if _[R3]>0 LOOP 
Move R3, #8 如 果 不 是 最 后 一 位 数字 则 返回 循环 
Move R4, #HEX 等 待 显 示 器 准备 就 绪 
LoadByte R5, DISP_STATUS ”检查 DOUT 标识 
And R5, R5, 幸 
Branch if_[R5]=0 DLOOP 
LoadByte R6, (R4) 获取 下 一 个 ASCII 字符 
StoreByte R6, DISP_DATA 将 其 发 送 到 显示 器 上 
Subtract R3, R3, #1 递减 计数 器 
Add R4, R4, #1 递增 字符 指针 
Branch_if_[R31>0 DLOOP 循环 ， 直 到 所 有 字符 都 显示 完毕 
下 一 条 指令 
ORIGIN 1000 
RESERVE 8 ASCII 编码 数字 的 存储 空间 
DATABYTE 0x30,0x31,0x32,0x33 ASCI 人 码 转换 表 
DATABYTE Ox34,0x35,0x36,0x37 
DATABYTE Ox38,0x39,0x41,0x42 
DATABYTE Ox43,0x44,0x45,0x46 

图 3-12 例 3.4 的 RISC 风格 的 程序 


Move 
Move 
Move 
RotateL 


Move 
And 
MoveByte 


Subtract 
Branch> 0 
Move 
Move 
TestBit 
Branch=0 
MoveByte 
Subtract 
Branch> 0 


下 一 条 指令 
ORIGIN 

RESERVE 
DATABYTE 
DATABYTE 


DATABYTE 
DATABYTE 


R2, BINARY 
R3, #8 

R4, #HEX 
R2, #4 


R5, R2 
RS5. #0xF 
(R4)+, TABLE(R5) 


R3, #1 

LOOP 

R3, #8 

R4, #HEX 
DISP_STATUS, #2 
DLOOP 
DISP_DATA, (R4)+ 
R3, #1 

DLOOP 


1000 

8 
Ox30,0x31.0x32,0x33 
Ox34,0x35.0x36,0x37 
Ox38,0x39,0x41,0x42 
Ox43,0x44,0x45,0x46 


- 载 人 二 进 制 数 


R3 是 一 个 被 设置 为 8 的 数字 计数 器 
R4 指向 十 六 进 制 数字 
把 高 位 数字 循环 移 位 到 低位 


提取 下 一 个 数字 
获取 数字 的 ASCI 码 并 将 其 存储 在 


HEX 单元 中 


递减 数字 计数 器 
如 果 不 是 最 后 一 位 数字 则 返回 循环 


等 待 显示 器 准备 就 绪 
将 下 一 个 字符 发 送 到 显示 器 上 


递减 计数 器 
循环 ， 直 到 所 有 字符 都 显示 完毕 


ASCII 编码 数字 的 存储 空间 
ASCII 码 转换 表 





图 3-13 例 3.4 的 CISC 风格 的 程序 
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读 取 这 个 状态 寄存 器 的 动作 会 自动 将 ZERO 和 TIRQ 位 清 0。 
e TIM_CONT 控制 操作 模式 ， 其 中 : 
四 UP 位 被 置 为 1 时 ， 计 数 器 递增 计数 ; 当 UP 位 被 清 为 0 时， 计数器 递减 计数 。 
四 FREE 位 被 置 为 1 时 ， 计 数 器 进入 持续 运行 模式 ， 此 时 ， 当 实际 计数 达到 0 时 会 自动 将 初始 
计数 值 重新 装 和 人 计数 器 中 。 
和 RUN 位 被 置 为 1 时， 计数 器 开始 计数 ; RUN 位 被 清 0 时 计数 器 停止 计数 。 
上 TIE 位 被 置 为 1 时 ， 人 允许 定时 器 中 断 。 
e TIM_INIT 保存 初始 计数 值 。 
e TIM_COUNT 保存 当前 的 计数 值 。 
写 一 个 程序 来 实现 所 需 的 任务 ， 使 用 图 3-7 中 所 描述 的 处 理 器 控制 寄存 器 。 
地 址 gj 


7 4 3 2 1 0 
Ox4020 | ; TIM_STATUS 
“CT meow 
Ox4028 | , 初始 计数 值 | TIM_INIT 
0x402C | 当前 计数 值 | TIM_COUNT 


图 3-14 定时 器 接口 中 的 寄存 器 


解答 : 为 了 每 10 秒 钟 能 获得 一 个 中 断 请 求 ， 需 要 计数 10? 个 时 钟 周期 。 可 以 这 样 实现 : 将 这 个 值 写 
和 人 TIM_INIT 寄存 器 ， 然 后 递减 计数 器 的 计数 ， 当 计数 达到 0 时 发 出 中 断 请 求 。10? 这 个 值 可 以 用 十 六 进 
制 数 3B9ACA00 来 表示 。 为 了 实现 所 需 的 操作 ，FREE、RUN 和 TIE 位 必须 被 置 为 1， 而 UP 位 则 必须 被 
置 为 0。 

使 用 图 3-9 中 概述 的 方法 ， 我 们 可 以 用 图 3-15 所 示 的 RISC 风格 的 程序 来 实现 所 需 的 任务 。 注 意 ， 
初始 计数 值 是 一 个 32 位 的 立即 值 ， 可 以 用 2.9 节 中 给 出 的 方法 将 其 装 人 R2 中 。 

图 3-16 给 出 了 用 图 3-11 概述 的 方法 实现 所 需 任务 的 CISC 风格 的 程序 。 在 这 里 ,32 位 的 立即 数 操作 
数 可 以 在 一 条 单一 的 指令 中 指定 。 
例 3.6 

问题 : 数字 系统 中 有 一 种 常用 的 输出 设备 七 段 显 示 器 ， 如 图 3-17 所 示 。 该 设备 包括 七 个 独立 的 数码 
管 段 ， 给 它们 加 上 电信 和 号 的 时 候 它们 可 以 被 点 亮 。 假 设 每 一 段 在 施加 逻辑 值 1 的 时 候 被 点 亮 。 图 中 给 出 
了 显示 数字 0 到 9 所 需 的 位 模式 。 

写 一 个 程序 ， 显 示 用 ASCII 编码 字符 表示 的 数 ， 该 ASCIL 编码 字符 存储 在 地 址 为 0x800 的 存储 单 
元 DIGIT 中 。 假 设 显 示 器 有 一 个 IO 接口 ， 它 包含 一 个 8 位 的 数据 寄存 器 SEVEN， 其 中 w 段 至 g 段 分 
别 连接 到 SEVEN 的 第 6 至 第 0 位 上 。 设 SEVEN 的 第 7 位 等 于 0。 另 外 ， 假 设 寄存 器 SEVEN 的 地 址 为 
0x4030。 如 果 DIGIT 单元 中 的 ASCII 码 表示 的 字符 不 是 0 到 9 范围 内 的 数 ， 则 显示 器 是 空白 的 ， 所 有 的 
段 都 被 关闭 。 

解答 : 可 以 使 用 一 个 查找 表 TABLE 来 保存 与 数字 0 到 9 相对 应 的 七 段位 模式 。 通 过 使 用 AND (与 ) 
操作 ， 可 以 将 ASCII 编码 的 数字 转换 为 可 作为 表 索 引 的 4 位 数 。 此 外 ， 需 要 检查 ASCII 码 的 高 4 位 是 否 
是 0011。 注 意 ，DIGIT、SEVEN 和 TABLE 这 三 个 地 址 可 以 用 16 位 来 表示 。 

图 3-18 和 图 3-19 分 别 给 出 了 可 能 的 RISC 风格 和 CISC 风格 的 程序 。 
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中 断 处 理 程 序 


ILOC: 


中 断 处 理 程序 
ILOC: 


COMPUTE: 


Subtract 
Store 

Store 
MoveControl 
And 


Branch_if_[R2]=0 


LoadByte 
Call 
Load 


Load 
Add 


SP SP #8 
LINK_reg, 4(SP) 
R2, (SP) 

R2, IPENDING 
R2, R2, #8 

NEXT 

R2, TIM_STATUS 
DISPLAY 


R2, (SP) 
LINK_reg, 4(SP) 
SP SP #8 


Return-from-interrupt 


OrHigh 

Or 

Store 

Move 
StoreByte 
MoveControl 
Or 
MoveControl 
MoveControl 
Or 
MoveControl 


下 一 条 指令 


R2, RO, #0x3B9A 
R2, R2, #0xCAOO 
R2, TIM_INIT 
R2, #7 

R2, TIM_CONT 
R2, IENABLE 
R2, R2, #8 
IENABLE, R2 
R2, PS 

R2, R2, #1 

PS, R2 


保存 寄存 器 

检查 IPENDING 的 内 容 
检查 是 否 是 定时 器 的 请 求 
清除 TIRQ 和 ZERO 位 
调用 DISPLAY 程序 
检查 其 他 中 断 


为 ISR 建立 参数 表 

准备 初始 计数 值 

设置 初始 计数 值 

将 定时 器 设置 为 持续 运行 
模式 ， 并 人 允许 中 断 3 


在 处 理 器 控制 寄存 器 中 多 
许 定时 器 中 断 


设置 PS 中 的 中 断 允 许 位 





图 3-15 例 3.5 的 RISC 风格 的 程序 


Move 

Move 
MoveControl 
TestBit 
Branch=0 
MoveByte 
Call 


Move 
Move 


—(SP), R2 

—(SP), LINK_reg 
R2, IPENDING 
R2, #3 

NEXT 

R2, TIM_STATUS 
DISPLAY 


LINK_reg, (SP)+ 
R2, (SP)+ 


Return-from-interrupt 


Move 
MoveByte 


MoveControl 
Or 
MoveControl 
MoveControl 
Or 
MoveControl 


下 一 条 指令 


TIM_INIT, #0x3B9ACAOO 
TIM_CON, #7 


R2, IENABLE 
R2, #8 
IENABLE, R2 
R2, PS 
R2, #1 
PS, R2 


保存 寄存 器 


检查 IPENDING 的 内 容 
检查 是 否 是 定时 器 的 请 求 


清除 TIRQ 和 ZERO 位 
调用 DISPLAY 程序 
检查 其 他 中 断 


为 ISR 建立 参数 表 
设置 初始 计数 值 
将 定时 器 设置 为 持续 运行 模 


式 ， 并 允许 中 断 9 


在 处 理 器 控制 寄存 器 中 允许 
定时 器 中 断 


设置 PS 中 的 中 断 允许 位 





图 3-16 例 3.5 的 CISC 风格 的 程序 


日 即将 TIM_CONT 寄存 器 的 FREE、RUN 和 TIE 位 都 秆 为 1。 一 一 译 者 注 


EQU 
EQU 
LoadByte 
And 

And 
Move 
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数字 be EE ff 
0 lt 1 了 10 
1 0 1 1 0 0 0 0 
2 1 10 1 1 光 1 
3 1 1 1 1 41 
4 1 1 0 0 1 4 
5 1 0116 1 
6 LOL Li 
7 1 1 1 0 0 0 0 
8 1 4 1 1 11 1 
9 1 1 1 1 0 3 1 | 





图 3-17 七 段 显示 器 


Ox800 ASCI 编码 数字 的 位 置 
0x4030 七 段 显示 器 的 地 址 

R2, DIGIT 载 人 ASCII 编码 的 数字 

R3, R2, #OxFO0 提取 ASCII 码 的 高 位 

R2, R2, #0xOF 提取 十 进 制 数 

R4, #0x30 检查 ASCII 码 的 高 位 是 否 是 


Branch_if_[R3]=[R4] HIGH3 0011 
Move 


LoadByte 
StoreByte 


ORIGIN 

DATABYTE 
DATABYTE 
DATABYTE 
DATABYTE 


图 3- 


EQU 

EQU 

Move 

Move 

And 

And 
CompareByte 
Branch=0 


Move 
MoveByte 


ORIGIN 

DATABYTE 
DATABYTE 
DATABYTE 
DATABYTE 


图 3- 


习题 


R2, #0xOF 如 果 不 是 数字 ， 显 示 空 白 
R5, TABLE(R2) 获得 七 段 模式 
R5, SEVEN 显示 数字 


Ox1000 
Ox7E,0x30,0x6D,0x79 包含 七 段 模式 的 表 
Ox33,0x5B,0x5F,0x70 
Ox7F,0x7B,0x00,0x00 
Ox00,0x00,0x00,0x00 





18 例 3.6 的 RISC 风格 的 程序 


Ox800 ASCII 编码 数字 的 位 置 

0x4030 七 段 显示 器 的 地 址 

R2, DIGIT 载 入 ASCII 编码 的 数字 

R3, R2 

R3, #0xF0 提取 ASCII 码 的 高 位 

R2, #0xOF 提取 十 进 制 数 

R3, #0x30 检查 ASCII 码 的 高 位 是 否 是 0011 
HIGH3 

R2, #0xOF 如 果 不 是 数字 ， 显 示 空 白 
SEVEN, TABLE(R2) 显示 数字 


Ox1000 

Ox7E,0x30,0x6D,0x79 包含 七 段 模式 的 表 
Ox33,0x5B,0x5F,0x70 

Ox7F,0x7B,0x00,0x00 

Ox00,0x00,0x00,0x00 





19 例 3.6 的 CISC 风格 的 程序 


[E] 3.1 一旦 输入 数据 寄存 器 被 读 取 ， 接 口 电路 中 的 输入 状态 位 就 会 被 清空 。 为 什么 要 这 么 做 ? 
[E] 3.2 写 一 个 程序 ， 在 显示 设备 的 一 行 上 以 16 进 制 形式 显示 主 存 中 10 个 字 节 的 内 容 。 这 10 个 字 节 从 


存储 器 的 LOC 单元 开始 ， 每 个 字 节 含有 两 个 16 进 制 字符 。 显 示 时 ， 连 续 的 字 节 用 空格 隔 开 。 


[E] 3.3 子 程序 与 中 断 服务 程序 的 区 别 是 什么 ? 
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[E] 3.4 在 图 3-4 中 的 第 一 条 And 指令 中 ， 在 检查 KIN 标识 的 时 候 使 用 了 立即 值 2， 但 在 图 3-5 中 的 第 一 
条 TestBit 指令 中 ， 检 查 KIN 标识 时 却 使 用 了 立即 值 1。 解 释 两 者 的 区 别 。 

[D] 3.5 有 一 台 计 算 机 ， 要 求 它 从 20 台 终 端的 键盘 输入 端 接收 字符 。 指 针 PNTRn 指向 用 于 存储 每 一 台 终 
端的 数据 的 主 存 区 域 ,n 从 1 到 20。 当 另 一 个 程序 PROG 正在 执行 时 ， 终 端的 输入 数据 必须 被 
收集 起 来 。 这 可 以 由 如 下 两 种 方法 实现 : 

(a ) 每 了 秒 钟 程序 PROG 调用 一 个 轮 询 子 程序 POOL。 这 个 子 程序 按 顺序 查询 所 有 20 台 终 端的 
状态 并 将 所 有 输入 字符 传送 到 存储 器 中 ， 然 后 返回 到 PROG。 

(b) 当 任 何 终端 的 接口 缓冲 区 中 有 就 绪 的 字符 时 ， 产 生 一 个 中 断 请 求 ， 然 后 中 断 服务 程序 
INTERRUPT 被 执行 。INTERRUPT 查询 状态 寄存 器 以 找 出 第 一 个 就 绪 的 字符 ， 传 送 该 字符 ， 
然后 返回 到 PROG。 

编写 程序 POOL 和 INTERRUPT。 假 设 所 有 终端 的 最 大 字符 输入 速率 为 每 秒 c 个 字符 ,平均 速率 

等 于 m， 其 中 ~ 科 1。 在 方法 (a) 中 ， 能 够 保证 不 丢失 输入 字符 的 了 的 最 大 值 是 多 少 ? 在 方法 

(b) 中 ， 等 价 的 了 值 又 是 多 少 ? 估计 一 下 ,在 c=100, + 分 别 为 0.01、0.1、0.5 和 1 时 , 方法 (a) 

和 (b) 中 服务 终端 的 平均 时 间 百 分 比 是 多 少 。 假 设 POLL 花费 800 纳 秒 去 查询 所 有 20 台 设 备 ， 

处 理 设备 的 中 断 需 要 200 纳 秒 。 

[E] 3.6 在 图 3-9 中 ， 主 程序 的 START 段 最 后 才 设 置 PS 中 的 中 断 允 许 位 ， 这 是 为 什么 ? 该 顺序 对 
START 中 之 前 的 操作 是 否 有 影响 ? 为 什么 ? 

[E] 3.7 即使 有 多 个 中 断 请 求 等 待 处 理 ， 图 3-9 中 每 次 进入 ILOC 时 仍 只 能 处 理 一 个 请 求 。 以 上 说 法 是 
正确 还 是 错误 ?说 明理 由 。 

[E] 3.8 一 个 用 户 程序 可 以 在 每 次 除法 操作 前 立刻 检查 除数 是 否 为 0， 然 后 采取 适当 的 动作 而 不 去 调用 操 
作 系 统 。 给 出 理由 说 明 为 什么 在 用 户 程序 中 除数 为 0 的 实际 情况 下 ， 人 允许 产生 一 个 异常 中 断 是 / 
不 是 最 好 的 。 

[M] 3.9 假设 一 个 存储 单元 BINARY 包含 一 个 16 位 的 模式 。 要 求 在 具有 图 3-3 所 示 接 口 的 显示 设备 上 把 
这 些 位 显示 为 0 和 1 组 成 的 字符 串 。 写 一 个 RISC 风格 的 程序 完成 这 个 任务 。 

[M] 3.10 写 一 个 CISC 风格 的 程序 完成 习题 3.9 中 的 任务 。 

[E] 3.11 如 果 TABLE 的 地 址 是 0x10100， 修 改 图 3-18 中 的 程序 。 

[E] 3.12 如 果 TABLE 的 地 址 是 0x10100， 修 改 图 3-19 中 的 程序 。 

[M] 3.13 使 用 图 3-17 中 的 七 段 显示 器 以 及 图 3-14 中 的 定时 器 接口 寄存 器 ， 写 一 个 RISC 风格 的 程序 ， 显 
示 十 进 制 数字 的 重复 序列 0、1、2、…、9、0、…， 每 一 个 数字 显示 一 秒 钟 。 假 设 定 时 器 电路 

中 的 计数 器 是 由 100MHz 的 时 钟 驱动 的 。 

[M] 3.14 写 一 个 CISC 风格 的 程序 完成 习题 3.13 中 的 任务 。 

[D] 3.15 使 用 两 个 图 3-17 所 示 的 七 段 显示 器 以 及 图 3-14 中 的 定时 器 接口 寄存 器 ， 写 一 个 RISC 风格 的 程 
序 ， 显 示 十 进 制 数 的 重复 序列 0、1、2、…、98、99、0、…， 每 个 数 显示 一 秒 钟 。 假 设 定时 器 
电路 中 的 计数 器 是 由 100MHz 的 时 钟 驱动 的 。 

[D] 3.16 写 一 个 CISC 风格 的 程序 完成 习题 3.15 中 的 任务 。 

[D] 3.17 写 一 个 RISC 风格 的 程序 ， 计 算 挂钟 时 间 并 以 小 时 (0 到 23 ) 和 分 钟 (0 到 59 ) 的 形式 显示 时 
间 。 显 示 器 包括 4 个 图 3-17 所 示 的 七 段 显 示 器 。 还 有 一 个 具有 图 3-14 所 示 接 口 寄 存 器 的 定时 
器 电路 ， 其 计数 器 是 由 100MHz 的 时 钟 驱动 的 。 

[D] 3.18 写 一 个 CISC 风格 的 程序 完成 习题 3.17 中 的 任务 。 

[M] 3.19 写 一 个 RISC 风格 的 程序 ， 倒 序 显示 用 户 的 名 字 。 该 程序 应 能 显示 一 个 提示 符 ， 要 求 在 键盘 上 
输入 用 户 名 的 字符 ， 并 以 回 车 符 ( CR ) 结束 。 该 程序 还 应 该 能 接受 字符 序列 并 将 它们 保存 在 主 
存 中 。 然 后 它 应 显示 一 条 消息 ， 来 指示 该 用 户 的 名 字 将 被 倒序 显示 ， 紧 接着 就 以 相反 的 顺序 显 
示 用 户 名 的 字符 。 

[M] 3.20 写 一 个 CISC 风格 的 程序 完成 习题 3.19 中 的 任务 。 

[M] 3.21 写 一 个 RISC 风格 的 程序 ， 确 定 用 户 在 键盘 上 输入 的 单词 是 否 是 回 文 。 回 文 是 指 其 字符 以 正常 
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顺序 或 者 相反 顺序 写 出 时 都 相同 的 单词 。 该 程序 应 能 显示 一 个 提示 符 ， 要 求 用 户 在 键盘 上 输入 
任意 一 个 单词 的 字符 ， 并 以 回 车 符 (CR ) 结束 。 该 程序 还 应 该 能 读 取 这 些 字 符 并 将 它们 保存 在 
主 存 中 。 然 后 分 析 该 单词 以 确定 它 是 否 是 一 个 回 文 。 最 后 ， 该 程序 应 显示 一 条 消息 ， 以 说 明 分 
析 的 结果 。 

[M] 3.22 写 一 个 CISC 风格 的 程序 完成 习题 3.21 中 的 任务 。 

[D] 3.23 写 一 个 RISC 风格 的 程序 ， 在 一 个 标准 的 80 个 字符 的 行 上 水 平 居中 显示 一 个 字符 串 ， 并 将 其 封 
闭 在 一 个 盒子 中 ， 如 下 所 示 。 


十 ------------- + 
| sample text | 
十 =======-====- 丰 


该 字符 串 存储 在 以 地 址 STRING 开始 的 主 存 中 。 字 符 串 的 末尾 有 一 个 NUL 控制 字符 ( 值 为 0 )。 
如 果 该 字符 串 含 有 78 个 以 上 的 字符 (包括 空格 )， 则 程序 应 将 显示 的 字符 串 截 断 为 78 个 字符 。 
可 以 将 例 2.1 中 确定 字符 串 长 度 的 程序 改写 为 本 问题 中 的 程序 所 使 用 的 一 个 子 程序 。 假 设 显示 
设备 具有 图 3-3 所 示 的 接口 。 

[D] 3.24 写 一 个 CISC 风格 的 程序 完成 习题 3.23 中 的 任务 。 

[D] 3.25 写 一 个 RISC 风格 的 程序 ， 显 示 一 个 ASCII 字符 编码 的 文本 长 序列 ， 为 了 适应 每 行 80 个 字符 ， 
该 文本 序列 应 能 自动 换行 。 在 显示 下 一 个 单词 前 ， 该 程序 必须 确定 本 行 剩 下 的 空间 是 否 足 以 显 
示 这 个 单词 。 如 果 不 够 ， 该 单词 应 该 在 下 一 行 的 开头 显示 。 当 到 达 要 显示 的 字符 序列 末端 的 
NUL 控制 字符 ( 值 为 0) 时 ， 显 示 过 程 结束 。 假 设 该 字符 序列 不 使 用 除了 末端 的 NUL 字符 之 
外 的 控制 字符 ， 因 此 单词 间 仅 用 一 个 空格 字符 隔 开 。 假 设 显 示 设 备 具有 图 3-3 所 示 的 接口 。 

[D] 3.26 写 一 个 CISC 风格 的 程序 完成 习题 3.25 中 的 任务 。 
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软 件 


本 章 目 标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

。 准备 及 运行 程序 所 需 的 软件 

e 汇编 程序 

e 装载 程序 

e 连接 程序 

e 编译 器 

e@ 调试 回 

e 汇编 语言 与 C 语言 之 间 的 交互 

。 操作 系统 

第 2 章 介 绍 了 计算 机 的 指令 集 并 阐述 了 如 何 用 汇编 语言 编写 程序 。 第 3 章 中 又 描述 了 如 何 
编写 可 以 执行 输入 /输出 操作 的 程序 。 在 本 章 中 ， 我 们 将 概述 准备 及 运行 程序 所 需 的 软件 。 

汇编 语言 程序 是 使 用 程序 员 易 于 理解 的 符号 表示 来 编写 的 ， 而 这 些 程序 必须 在 翻译 成 机 

器 语言 代码 之 后 才能 在 计算 机 上 运行 ， 就 像 在 2.5 节 中 所 解释 的 那样 。 这 是 由 汇编 程序 来 完成 

的 ， 它 解释 表示 机 器 指令 的 助 记 符 以 及 表示 数据 声明 ee 

在 阐述 了 如 何 编写 汇编 语言 程序 之 后 ， 现 在 我 们 将 讨论 程序 运行 前 的 整个 准备 过 程 ， 我 
们 将 描述 : 

e 由 汇编 语言 编写 的 源 程序 是 如 何 被 翻译 成 包含 二 进 制 形式 的 机 器 指令 及 数据 的 目标 程 
序 的 ? 
目标 程序 是 如 何 装 入 计算 机 的 存储 器 中 的 ? 
程序 的 执行 是 如 何 开始 及 结束 的 ? 
一 个 较 大 的 程序 是 如 何 由 若干 个 相关 的 程序 连接 而 成 的 ? 

程序 DY A 

然后 ， 我 们 将 探讨 用 高 级 语言 (如 C ) 准备 程序 时 的 一 些 相关 问题 。 最 后 还 将 介绍 操作 系 

统 软件 在 管理 和 协调 计 算 机 资源 的 使 用 方面 的 作用 。 


4.1 汇编 过 程 

为 了 准备 源 程 序 ， 程 序 员 可 以 通过 使 用 一 个 称 为 文本 编辑 器 (text editor ) 的 实用 程序 在 
键盘 上 输入 源 程序 语句 并 将 其 保存 在 一 个 文件 〈file ) 中 。 包 含 源 程序 的 文件 是 一 个 二 进 制 编 
码 的 字符 序列 。 文 件 是 由 用 户 选 择 的 名 字 来 标识 的 ， 通 常 将 文件 存储 在 辅助 存储 设备 中 ， 如 
磁盘 。 

源 文件 准备 就 绪 后 ， 程 序 员 使 用 另 一 个 称 为 汇编 程序 (assembler) 的 实用 程序 来 将 汇编 语 
言 编写 的 源 程序 翻译 成 由 机 器 指令 组 成 的 目标 程序 ， 这 一 过 程 通常 称 为 汇编 (assemble) 一 个 程 
序 。 汇 编程 序 还 可 将 汇编 语言 表示 的 数据 转化 为 二 进 制 模式 ， 它 也 是 目标 程序 的 一 部 分 。 在 将 
源 文件 从 磁盘 装 入 存储 器 并 将 其 翻译 成 目标 程序 之 后 ， 汇 编程 序 将 把 目标 程序 存储 在 磁盘 上 一 
个 单独 的 文件 中 。 
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源 程序 使 用 助 记 符 来 表示 机 器 指令 中 的 操作 ( OP ) 码 。 有 一 组 语法 规则 来 管理 这 些 指令 
中 数据 操作 数 的 寻 址 方式 规范 。 汇 编程 序 为 操作 码 和 其 他 的 指令 字段 生成 二 进 制 编码 。 

汇编 程序 可 以 识别 用 于 指明 数字 和 字符 的 汇编 指示 以 及 为 数据 区 分 配 存储 空间 的 汇编 指 
示 。 程 序 员 可 以 使 用 EQU ( 等 于 ) 指示 来 定义 常量 的 名 字 ， 然 后 ， 这 些 名 字 可 以 被 当 作 指 令 
中 的 操作 数 在 源 程序 中 直接 使 用 。 同 样 这 些 名 字 还 可 以 被 定义 为 转移 目标 的 地 址 标签 、 子 程序 
的 入口 指针 ,或 者 存储 器 中 的 数据 单元 。 地 址 标签 可 根据 它们 相对 于 汇编 后 程序 的 开头 位 置 来 
赋值 。 

当 汇 编程 序 扫描 一 个 源 程序 时 ， 它 将 所 有 名 字 及 其 对 应 的 值 都 记录 在 一 个 符号 表 ( symbol 
table ) 中 。 每 当 出 现 一 个 名 字 ， 就 用 它 在 表 中 的 值 替 换 它 。 


二 人 遍 扫描 汇编 程序 

当 一 个 名 字 在 定义 它 的 值 之 前 作为 一 个 操作 数 出 现时 ， 便 会 引发 一 个 问题 。 例 如 ， 当 需 
要 向 前 转移 到 在 后 面 的 程序 中 才 会 出 现 的 一 个 地 址 标签 时 就 会 发 生 这 种 情况 。 正 如 在 2.5.2 节 
中 所 讨论 的 ， 汇 编程 序 使 用 转移 目标 地 址 来 计算 转移 的 偏 移 量 。 向 前 转移 的 情况 下 ， 汇 编程 序 
不 能 确定 转移 目标 的 地 址 ， 因 为 地 址 标签 的 值 还 没有 被 记录 到 符号 表 中 。 

解决 这 个 问题 的 常用 方法 是 让 汇编 程序 对 源 程 序 做 二 遍 扫描 。 在 第 一 遍 扫描 期 间 ， 它 建 
立 一 个 符号 表 。 对 于 EQU 指示 ， 每 个 名 字 和 它 定义 的 值 被 记录 在 符号 表 中 。 对 于 地 址 标签 ， 
汇编 程序 用 每 个 名 字 相 对 于 源 程 序 开 始 的 位 置 来 确定 它 的 值 ， 也 就 是 把 定义 名 字 的 语句 出 现 之 
前 所 处 理 过 的 所 有 机 器 指令 的 大 小 相 加 来 确定 。 在 第 一 遍 扫描 结束 时 ， 源 程序 中 出 现 的 所 有 名 
字 都 已 经 在 符号 表 中 被 分 配 了 数值 。 然 后 汇编 程序 对 源 程序 做 第 二 遍 扫 描 ， 在 符号 表 中 查找 它 
遇 到 的 每 一 个 名 字 ， 并 替换 相应 的 数值 。 这 样 的 二 遍 扫 描 (two-pass ) 汇编 程序 会 产生 一 个 完 
整 的 目标 程序 。 


4.2 ”装载 及 执行 目标 程序 

汇编 程序 所 产生 的 目标 程序 存储 在 磁盘 上 的 文件 中 。 为 了 执行 一 个 特定 的 目标 程序 ， 首 
先 要 将 其 从 磁盘 装 和 内存 中 ， 然 后 再 把 将 要 执行 的 第 一 条 指令 的 地 址 装 人 程序 计数 器 中 。 用 来 
执行 这 些 操作 的 实用 程序 为 装载 程序 ( loader )。 

当 用 户 输 入 一 个 命令 来 执行 存储 在 磁盘 上 的 目标 程序 时 ， 装 载 程序 将 被 调用 。 用 户 命 令 
指明 了 目标 文件 的 名 字 ， 这 使 得 装载 程序 可 以 从 磁盘 上 找到 该 文件 。 然 后 装载 程序 将 目标 程序 
从 磁盘 传送 到 内 存 的 指定 位 置 上 。 它 必须 知道 这 个 程序 的 长 度 和 将 要 存放 它 的 内 存 地 址 。 汇 编 
程序 通常 把 这 些 信 息 放 在 目标 文件 的 头 部 ， 即 目标 程序 的 机 器 指令 和 数据 之 前 。 

用 户 可 以 通过 键盘 来 输入 命令 ， 也 可 以 使 用 一 种 更 常用 的 方法 ， 即 图 形 用 户 界面 
( graphical user interface，GUI ) 来 输入 命令 。 在 这 种 情况 下 ， 用 户 使 用 鼠标 来 选择 所 需 的 目标 
文件 。 然 后 ，GUI 软件 将 目标 文件 在 磁盘 上 的 位 置信 息 传 递 给 装载 程序 。 

一 旦 目标 程序 被 装 人 内 存 中 ， 装 载 程序 就 转移 到 将 要 执行 的 第 一 条 指令 处 开始 执行 。 在 
源 程序 中 ， 程 序 员 用 一 个 特定 的 地 址 标签 ， 如 START， 来 指示 第 一 条 指令 。 汇编 程序 将 该 地 
址 标签 的 值 包含 在 目标 程序 的 头 部 。 

当 目 标 程序 执行 完 它 的 任务 时 ， 它 的 执行 必须 以 一 种 明确 的 方式 结束 。 这 将 收回 包含 目 
标 程序 的 内 存 空间 ， 并 人 允许 用 户 输入 一 个 新 的 命令 来 执行 另 一 个 目标 程序 。 这 些 问题 通常 由 操 
作 系 统 ( OS ) 软件 来 处 理 ， 我 们 将 在 4.9 节 讨 论 操作 系统 软件 。 
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4.3 连接 程序 

在 前 面 的 章节 中 ， 我 们 假设 一 个 特定 程序 中 的 所 有 指令 及 数据 都 在 一 个 单独 的 源 文件 中 
指定 ， 汇 编程 序 从 该 源 文件 产生 一 个 目标 程序 。 而 在 许多 情况 下 ， 程 序 员 可 能 希望 调用 其 他 程 
序 员 所 编写 的 子 程序 。 但 是 将 所 有 需要 的 子 程序 从 多 个 不 同 的 源 文件 收集 到 一 个 单独 的 源 文件 
中 来 由 汇编 程序 处 理 是 不 方便 或 不 实际 的 。 

然而 ， 有 一 个 常见 的 过 程 可 以 对 每 一 个 源 文 件 单独 汇编 。 在 这 种 情况 下 ， 每 一 个 单独 的 
输出 文件 将 不 会 是 一 个 完整 的 目标 程序 。 每 个 程序 可 能 包含 外 部 名 (external name ) 的 引用 ， 
外 部 名 是 在 其 他 源 文件 中 定义 的 地 址 标签 。 当 汇编 程序 处 理 一 个 源 文件 时 ， 它 将 识别 出 这 样 的 
外 部 引用 ， 并 建立 一 个 关于 这 些 名 字 和 引用 它们 的 指令 的 列表 ， 然 后 汇编 程序 将 该 列表 包含 在 
它 从 源 程序 产生 的 目标 文件 中 。 

一 个 被 称 为 连接 程序 (linker ) 的 实用 程序 可 用 来 将 不 同 目标 文件 的 内 容 合 并 到 一 个 目标 
程序 中 。 它 使 用 每 个 目标 文件 中 记录 的 信息 来 解析 外 部 名 的 引用 。 连 接 程 序 需要 源 文件 中 所 定 
义 地 址 标签 的 相对 地 址 ， 从 而 当 它 合并 不 同 的 目标 文件 时 可 以 确定 地 址 标签 的 绝对 地 址 值 。 为 
达到 这 个 目的 ， 必 须 从 每 个 源 文件 中 导出 ( export ) 可 能 在 其 他 源 文件 中 引用 的 地 址 标签 相关 
信息 。 通 常 程序 员 需 要 标记 出 将 要 被 导出 的 特定 标签 。 汇 编程 序 将 导出 的 名 字 与 程序 中 用 到 的 
外 部 名 列表 和 引用 外 部 名 的 指令 一 起 包含 在 它 所 产生 的 每 一 个 目标 文件 中 。 

连接 程序 使 用 每 个 目标 文件 中 的 信息 和 机 器 语言 程序 的 已 知 长 度 来 构造 最 终 合并 的 目标 
文件 的 存储 器 上 映像。 一旦 所 有 单独 的 目标 文件 被 收集 在 一 起 并 在 内 存 中 给 它们 分 配 了 最 终 的 存 
储 单元 ， 被 导出 的 地 址 标签 所 对 应 的 最 终 值 就 可 以 被 确定 。 这 时 候 就 可 以 解决 外 部 名 的 引用 问 
题 了 。 由 连接 程序 确定 的 最 终 地 址 值 将 代 和 人 包含 外 部 引用 的 特定 指令 中 。 一 旦 解决 了 所 有 的 外 
部 引用 问题 ， 就 生成 了 最 终 的 目标 程序 。 

程序 员 可 以 在 目标 文件 中 明确 地 确定 一 些 指令 和 数据 的 地 址 。 这 可 以 通过 在 汇编 语言 源 
程序 中 使 用 类 似 ORIGIN 这 样 的 指示 语句 来 完成 。 在 这 种 情况 下 ， 程 序 员 必 须 确保 不 同 目标 文 
件 中 的 指令 和 数据 不 能 在 内 存 中 重 又 。 男 一 种 更 灵活 的 方法 是 不 使 用 ORIGIN 指示 ， 而 是 让 连 
接 程 序 自由 选择 目标 程序 的 起 始 地 址 并 相应 地 分 配 绝对 地 址 。 连 接 程 序 要 确保 不 同 的 目标 文件 
不 会 彼此 重 伙 或 与 特定 的 存储 单元 ( 如 中 断 向 量 ) 重 倒 。 


4.4 库 


为 某 个 应 用 程序 所 编写 的 子 程序 可 能 也 会 被 其 他 的 应 用 程序 使 用 。 一 个 普遍 的 做 法 是 将 
包含 这 些 子 程序 的 目标 文件 聚集 到 一 个 存储 在 磁盘 上 的 库 〈library ) 文件 中 。 然 后 ， 库 文件 中 
的 子 程序 可 以 与 其 他 任何 应 用 程序 的 目标 文件 进行 链接 。 库 文件 是 由 称 为 归档 程序 (archiver ) 
的 实用 程序 用 来 创建 的 。 库 文件 包含 连接 程序 用 来 解决 调用 库 例 程 的 程序 中 外 部 名 引用 问题 所 
需 的 信息 。 

当 调 用 连接 程序 时 ， 程 序 员 需 要 指定 所 需 的 库 文件 。 然 后 连接 程序 从 库 文 件 中 提取 相关 
的 目标 文件 并 将 其 包含 到 最 终 的 目标 程序 中 。 


4.5 ”编译 器 

用 汇编 语言 编程 需要 了 解 特定 机 器 的 细节 知识 ， 因 为 不 同 计算 机 的 细节 各 不 相同 。 而 用 
C、C++ 或 Java 这 样 的 高 级 语言 编程 则 不 需要 这 些 知识 。 用 高 级 语言 编写 的 程序 在 一 台 计 算 机 
上 运行 之 前 ， 它 必须 先 被 翻译 成 该 计算 机 的 汇编 语言 ， 然 后 再 被 翻译 成 机 器 语言 。 一 个 被 称 为 
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编译 器 ( compiler ) 的 实用 程序 用 来 执行 第 一 个 任务 。 程 序 员 用 高 级 语言 准备 源 程序 ， 并 将 其 
存储 在 磁盘 上 。 编 译 器 从 这 个 源 文 件 生成 汇编 语言 指令 和 指示 ， 并 将 其 写 人 一 个 输出 文件 中 。 
然后 ， 编 译 器 调用 汇编 程序 对 该 文件 进行 汇编 。 

将 一 个 高 级 语言 编写 的 源 程序 划分 为 多 个 文件 ， 并 根据 相关 的 任务 将 子 程序 分 类 组 合 是 
非常 方便 的 。 在 每 个 源 文件 中 ， 必 须 声 明 其 他 文件 中 的 外 部 子 程序 名 和 数据 变量 名 。 这 就 需要 
编译 器 来 检查 数据 类 型 并 检测 错误 。 针 对 每 一 个 源 文件 ， 编 译 器 都 会 生成 一 个 汇编 语言 文件 ， 
然后 调用 汇编 程序 来 产生 一 个 目标 文件 。 连 接 程序 合并 所 有 的 目标 文件 ， 包 括 库 例 程 ， 来 创建 
最 终 的 目标 程序 。 

用 高 级 语言 编程 的 一 个 重要 好 处 就 是 编译 器 会 自动 完成 用 汇编 语言 编程 时 程序 员 必 须 做 
的 许多 繁琐 的 任务 。 例 如 ， 在 生成 子 程序 的 汇编 语言 表示 形式 时 ， 编 译 需 将 执行 所 有 跟 堆 栈 帧 
的 管理 有 关 的 任务 。 


4.5.1 编译 器 优化 

如 果 编 译 器 使 用 一 个 简单 的 方法 将 高 级 语言 编写 的 源 程序 编译 成 汇编 语言 程序 ， 那 么 所 
产生 的 程序 在 执行 时 间或 大 小 方面 可 能 不 会 是 最 有 效 的 。 如 果 编 译 器 使 用 一 些 技 术 ， 如 重 排序 
章 令 ， 就 会 获得 较 高 的 性 能 。 具 有 这 种 功能 的 编译 器 被 称 为 优化 〈optimiz ) 编译 器 。 

因为 一 个 程序 的 大 部 分 执行 时 间 都 花费 在 了 循环 上 ， 所 以 编译 器 可 以 特别 对 循环 进行 有 
效 的 优化 。 例 如 ， 一 个 高 级 语言 源 程序 使 用 一 个 内 存 变 量 作为 循环 计数 器 。 每 次 循环 都 需要 读 


出 该 变量 ， 递 增 其 值 后 再 写 回 。 用 汇编 语言 天 二 We 
实现 该 任务 时 可 使 用 Load、Add 和 Store 指令 
来 完成 循环 。 一 种 更 好 的 实现 方法 是 让 编译 
器 意识 到 ， 在 执行 循环 时 可 以 把 计数 器 的 值 

放 和 一 个 寄存 器 中 维护 。 在 这 种 情况 下 ， 循 编译 器 


环 中 就 不 再 需要 Load 和 Store 指令 。 只 需 在 
进入 循环 前 使 用 一 条 Load 指令 来 将 初始 值 放 


| 
入 到 寄存 器 中 ,在 退出 循环 后 ， 用 Store 指令 人 


来 记录 计数 器 的 最 终 值 即 可 。 
4.5.2 ”组 合 不 同 语言 编写 的 程序 
4.3 节 描 述 了 连接 程序 ， 它 可 以 将 多 个 
目标 文件 链接 起 来 生成 目标 程序 。 在 某 些 情 
况 下 ， 程 序 员 可 能 希望 将 用 高 级 语言 编写 的 CE 
源 文件 所 生成 的 目标 文件 以 及 用 汇编 语言 


写 的 源 文件 所 生成 的 目标 文件 组 合 起 来 。 例 
如 ， 程序 员 可 以 编写 特定 的 汇编 语言 子 程序 ， 
这 些 子 程序 被 精心 编写 以 实现 高 性 能 。 然 后 ， 


| 
一 个 高 级 语言 源 程序 可 以 调用 这 些 汇编 语言 一 | | 
子 程序 。 类 似 地 ， 汇 编 语言 程序 也 可 以 调用 世上 库 文件 》 
高 级 语言 子 程序 。 

图 4.1 给 出 了 从 多 个 源 文件 和 库 例 程 生 
成 目标 程序 的 完整 流程 。 图 4-1 生成 目标 程序 的 总 体 流程 图 
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4.6 调试 器 

当 在 程序 的 源 文件 中 没有 语法 错误 或 未 知 的 名 称 时 ， 就 可 以 成 功 地 生成 目标 程序 。 汇 编 
程序 、 编 译 器 、 连 接 程序 可 以 检测 并 报告 这 些 问题 。 然 后 程序 员 再 对 源 程序 进行 必要 的 修改 。 

然而 ， 当 目标 程序 执行 时 ， 由 于 存在 难以 查 出 的 编程 错误 或 bug， 所 以 可 能 会 产生 错误 的 
结果 。 为 了 帮助 程序 员 找 出 这 些 错误 ， 可 以 使 用 一 个 被 称 为 调试 器 (debugger ) 的 实用 程序 。 
它 使 程序 员 能 够 在 某 些 感 兴趣 的 点 上 停止 执行 目标 程序 ， 检 查 各 种 处 理 器 寄存 器 和 存储 单元 的 
内 容 。 程 序 员 可 以 用 这 种 方式 将 任何 执行 点 的 计算 值 与 期 望 的 结果 进行 比较 ， 以 此 来 确定 可 能 
存在 程序 错误 的 地 方 。 有 了 这 些 信 息 ， 程 序 员 就 可 以 修改 源 文件 的 错误 。 

为 支持 调试 器 的 功能 ， 处 理 器 通常 需要 有 特定 的 操作 模式 以 及 特定 的 中 断 。 调 试 功能 的 
两 个 实例 是 跟踪 模式 和 断 点 。 

1， 跟 踪 模 式 

当 处 理 器 运行 在 跟踪 ( trace ) 模式 下 时 ， 每 执行 完 一 条 指令 就 产生 一 次 中 断 。 每 当 发 生 这 
样 的 中 断 ， 调 试 器 程序 中 的 中 断 服 务 程序 就 会 被 调用 。 该 中 断 服务 程序 允许 调试 器 对 执行 过 程 
进行 控制 ， 可 以 使 用 户 输入 命令 来 检查 寄存 器 和 存储 单元 的 内 容 。 当 用 户 输入 一 条 命令 来 恢复 
目标 程序 的 执行 时 ， 中 断 返 回 指令 被 执行 。 接 着 执行 被 调试 程序 的 下 一 条 指令 ， 然 后 用 另 一 个 
中 断 再 次 转 到 调试 器 中 。 当 进入 调试 器 程序 时 ， 跟 踪 模 式 的 中 断 将 被 自动 禁止 ， 当 返回 到 目标 
程序 时 再 重新 允许 中 断 。 

2.， 断 点 

断 点 ( breakpoint ) 提供 了 与 跟踪 相似 的 基于 中 断 的 调试 功能 ， 只 是 被 调试 的 目标 程序 只 
在 程序 员 指 定 的 特定 点 发 生 中 断 。 例 如 ， 程 序 员 可 以 设置 一 个 断 点 来 确定 目标 程序 究竟 会 不 会 
运行 一 个 特定 的 子 程序 。 如 果 运 行 了 就 通过 一 个 中 断 转 到 调试 器 中 。 然 后 程序 员 可 以 检查 此 时 
的 处 理 状态 。 使 用 断 点 的 好 处 是 程序 的 执行 可 以 全 速 进行 直到 遇 到 断 点。 

断 点 通常 通过 一 条 被 称 为 陷阱 或 软件 中 断 的 特殊 指令 来 实现 。 该 指令 的 执行 会 产生 与 接 
收 到 一 个 硬件 中 断 请 求 时 相同 的 动作 。 当 调试 器 有 执行 控制 的 权限 时 ， 它 允许 用 户 在 目标 程序 
的 指令 i 前 设置 一 个 断 点 来 中 断 程 序 的 执行 。 调 试 器 将 指令 i 保存 到 一 个 临时 位 置 ， 并 用 一 条 
软件 中 断 指令 替换 它 。 然 后 用 户 输 入 命令 来 恢复 目标 程序 的 执行 ， 调 试 器 执行 一 条 中 断 返 回 指 
令 。 接 着 ， 目 标 程 序 的 指令 会 被 正常 处 理 ， 直 到 再 次 遇 到 软件 中 断 指令 。 那 时 ， 中 断 处 理会 导 
致 再 次 转 入 到 调试 器 中 ， 人 允许 用 户 检查 处 理 状态 。 

当 用 户 输入 命令 来 恢复 目标 程序 的 执行 时 ， 调 试 器 必须 执行 几 个 任务 ， 而 不 是 仅仅 执行 
指令 i， 它 还 将 再 次 设置 同样 的 断 点 。 它 必须 首先 将 指令 i 放 回 到 它 在 程序 中 的 原始 位 置 。 当 
程序 恢复 执行 时 ， 指 令 i 将 成 为 第 一 条 要 执行 的 指令 。 然 后 ， 调 试 器 必须 重新 设置 断 点 。 这 需 
要 在 指令 i 执行 后 安排 第 二 次 中 断 的 发 生 。 为 实现 此 目的 ， 如 果 可 能 的 话 可 以 使 用 跟踪 模式 ， 
或 者 ， 也 可 以 在 指令 二 1 的 位 置 上 设置 一 个 临时 断 点 ， 然 后 继续 执行 被 调试 的 程序 。 当 指令 i 
执行 完毕 ， 由 于 指令 it1 处 设置 了 临时 中 断 ， 因 此 发 生 第 二 次 中 断 。 此 时 ， 调 试 器 恢复 指令 
夺 1， 在 指令 处 重新 设置 断 点 ， 并 继续 执行 被 中 断 的 程序 。 


4.7 ”使 用 高 级 语言 实现 输入 / 输出 任务 
编译 器 、 汇 编程 序 以 及 连接 程序 为 程序 员 提供 了 相当 大 的 灵活 性 。 源 程序 可 以 完全 用 汇 


编 语 言 、 完 全 用 高 级 语言 或 者 用 几 种 语言 的 组 合 来 编写 。 在 大 多 数 应 用 中 ， 人 们 更 喜欢 使 用 高 
级 语言 ， 因 为 程序 开发 时 间 较 短 ， 并 且 所 需 的 代码 易于 生成 和 维护 。 在 本 节 及 下 一 节 中 ,我 们 
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将 给 出 一 些 使 用 C 语言 实现 IO 任务 的 实例 程序 来 说 明 这 种 方法 。 

考虑 下 面 的 IO 任务 。 一 个 程序 使 用 轮 询 法 来 从 键盘 上 读 取 用 户 输入 的 8 位 字符 并 将 它 
们 发 送 到 显示 器 上 。 第 3 章 介 绍 过 此 类 设备 的 存储 器 映射 接口 实例 。 图 4-2 显示 了 一 个 实现 
该 IO 任务 的 汇编 语言 程序 ， 该 程序 使 用 了 图 3-3 所 示 的 接口 。 


KBD_ DATA EQU 
KBD_STATUS EQU 
DISP DATA EQU 
DISP_STATUS EQU 


Move 
Move 


LoadByte 

And 

Branch_if_[R4]=0 

LoadByte 
DISP_LOOP: LoadByte 

And 

Branch_if_[R4]=0 

StoreByte 

Branch 


Ox4000 
0x4004 
Ox4010 
Ox4014 


R2, #KBD_DATA 
R3, #DISP_DATA 


R4, 4(R2) 
R4, R4, #2 
KBD_LOOP 
R5, (R2) 

R4, 4(R3) 
R4, R4, 村 
DISP_LOOP 
R5, (R3) 
KBD_LOOP 





键盘 数据 寄存 器 (8 位 ) 

键盘 状态 寄存 器 ( 第 一 位 为 KIN 标志 ) 
显示 器 数据 寄存 器 (8 位 ) 
显示 器 状态 寄存 器 (第 二 位 为 DOUT 标志 ) 


键盘 设备 接口 指针 
显示 设备 接口 指针 


检查 是 否 有 来 自 键盘 的 字符 


读 取 接 收 到 的 字符 
检查 显示 器 是 否 准备 好 显示 一 个 字符 


将 接收 到 的 字符 写 到 显示 器 


图 4-2 ”将 字符 从 键盘 传送 至 显示 器 的 汇编 语言 程序 


图 4-3 给 出 了 一 个 执行 同样 任务 的 C 语言 程序 。 在 C 语言 中 ， 指 针 可 以 被 设置 为 指向 任 
意 的 存储 单元 ， 包 括 存储 器 映射 VO 单元 。 此 指针 的 值 是 我 们 所 要 访问 单元 的 地 址 。 如 果 该 单 
元 的 内 容 被 当 作 是 一 个 字符 ， 那 么 指针 就 应 该 被 声明 为 字符 类 型 的 。 这 会 将 该 内 容 定义 为 一 个 
字 节 长 度 ， 也 就 是 图 3-3 中 VO 寄存 器 的 大 小 。 图 4-3 中 的 define 语句 用 于 将 所 需 的 地 址 常量 
与 指针 的 符号 名 关联 起 来 。 这 些 语句 与 图 4-2 中 的 EQU 语句 达到 同样 的 目的 。 它 们 使 得 编译 
器 将 程序 中 的 符号 名 替换 为 数值 。define 语句 同样 也 指明 了 指针 的 数据 类 型 。 然 后 编译 器 可 以 
用 已 知 值 和 正确 的 数据 大 小 来 生成 汇编 语言 指令 。 


人 # 定 义 寄 存 器 地 址 */ 
#define KBD DATA 
#define KBD_STATUS 
#define DISP_DATA 
#define DISP_STATUS 


void main() 
{ 


char ch:; 


人 # 传输 字符 */ 
while (1) { 
while ((*KBD_STATUS & 0x2) == 0); ”/* 等 待 新 字符 */ 


(volatile char *) Ox4000 
(volatile char *) Ox4004 
(volatile char *) Ox4010 
(volatile char *) Ox4014 


ch = *KBD_DATA: 
while ((*DISP_STATUS & 0x4) == 0); ”/* 等 待 显示 器 准备 就 绪 */ 


*DISP_DATA = 


图 4-3 与 图 4-2 


ch; 





族 死 循环 */ 
上 # 从 键盘 读 取 字 符 */ 
让 传输 字符 到 显示 器 */ 


中 汇编 语言 程序 执行 同样 任务 的 C 程序 


注意 ， 指 针 KBD_STATUS 和 DISP_STATUS 被 定义 为 volatile 类 型 。 这 是 必需 的 ， 因 为 程 
序 只 读 取 相 应 单元 的 内 容 ， 而 没有 数据 会 被 写 到 这 些 单元 中 。 优 化 编译 器 可 能 会 删除 那些 看 起 
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来 没有 影响 的 程序 语句 ， 包 括 那 些 引用 被 读 取 过 但 从 未 写 和 人 过 的 存储 单元 的 语句 。 因 为 存储 顺 
映射 寄存 器 KBD_STATUS 和 DISP_STATUS 的 内 容 是 随 程 序 外 部 的 影响 而 变化 的 ， 所 以 必须 
告知 编译 器 这 一 事实 。 编 译 器 将 不 会 删除 那些 包含 被 声明 为 volatile 类 型 的 指针 或 其 他 变量 的 
语句 。 

对 于 包含 高 速 缓存 的 计算 机 来 说 ， 一 些 编译 器 对 volatile 类 型 的 指针 或 变量 有 额外 的 解 
释 。 高 速 缓存 是 一 个 容量 小 、 速 度 快 的 存储 器 ， 它 保持 了 主 存 中 数据 的 副本 。 当 数据 可 在 高 速 
缓存 中 找到 时 ， 可 以 更 快速 地 执行 那些 引用 存储 单元 的 指令 。 然 而 ， 存 储 器 映射 VO 寄存 器 的 
数据 是 不 能 保存 在 高 速 缓存 中 的 ， 因 为 这 些 寄存 器 的 内 容 会 随 外 部 的 影响 而 变化 。 这 样 ， 对 这 
些 单元 的 引用 就 应 该 绕 过 ( 或 避 开 ，bypass ) 高 速 缓存 ， 而 直接 访问 LO 寄存 器 。 将 这 些 单元 
的 指针 声明 为 volatile 类 型 可 以 通知 编译 器 不 必 进 行 不 必要 的 优化 ， 可 产生 绕 过 高 速 缓存 的 存 
储 器 访问 指令 。 

在 图 4-3 中 ,我 们 将 表示 位 位 置 特定 值 的 数值 常量 包含 到 两 个 状态 寄存 器 中 。 例 如 ， 下 列 
培 人 名 

while ((*KBD STATUS & 0x2) 一 0); 
其 中 的 常量 0x2 用 于 检测 KBD_STATUS 寄存 器 中 的 b 位 是 否 被 设置 过 。 这 里 使 用 的 方法 使 其 
更 容易 将 给 定 值 与 图 3-3 中 的 设备 接口 规范 进行 比较 。 在 编写 C 程序 时 ， 一 种 更 通常 的 方法 
是 包含 define 语句 来 将 有 意义 的 名 称 与 这 样 的 常量 值 关 联 起 来 ， 然 后 在 程序 的 其 他 部 分 使 用 
该 名 称 。 


4.8 汇编 语言 与 C 语言 的 交互 

一 个 程序 可 能 偶尔 需要 访问 处 理 器 中 的 控制 寄存 器 。 例 如 ， 中 断 服 务 程序 的 初始 化 就 需 
要 访问 处 理 器 中 的 控制 寄存 器 。 编 译 器 不 能 根据 高 级 语言 中 的 一 个 语句 来 生成 访问 处 理 器 中 控 
制 寄 存 器 的 汇编 语言 指令 。 因 为 达到 此 目的 需要 使 用 汇编 语言 指令 ， 所 以 编译 器 允许 将 汇编 语 
言 指令 直接 包含 在 高 级 语言 程序 中 。 本 节 将 介绍 这 种 方法 。 

考虑 一 个 从 键盘 传输 字符 到 显示 器 的 LO 任务 。 假 设 使 用 中 断 从 键盘 接口 接收 字符 。 为 使 
例子 简单 ， 假 设 中 断 服 务 程序 将 每 一 个 接收 到 的 字符 直接 发 送 到 显示 器 接口 ， 而 不 需要 轮 询 显 
示 器 接口 的 状态 ， 但 前 提 是 字符 能 以 足够 低 的 速率 被 接收 ， 以 便于 显示 器 处 理 。 

此 程序 中 该 任务 的 初始 化 需要 访问 IO 寄存 器 和 处 理 器 控制 寄存 器 。 图 3-3 中 的 IO 接口 
需要 配置 为 当 KEN=1 时 可 以 提出 中 断 请 求 ，KBD_CONT 寄存 器 中 相应 的 中 断 允 许 位 KIE 必 
须 置 为 1。 同时， 需要 将 图 3-7 中 处 理 器 状态 (PS ) 寄存 器 的 正 位 和 IENABLE 控制 寄存 器 的 
KBD 位 置 为 1 以 允许 处 理 器 中 断 。 

第 3 章 中 描述 了 几 种 不 同 的 方法 识别 当 一 个 特定 的 中 断 发 生 时 所 要 执行 的 中 断 服务 程序 
的 首 地 址 。 其 中 向 量 中 断 法 对 不 同 的 中 断 源 使 用 一 些 预 定 的 存储 单元 来 保存 相应 中 断 服务 程序 
的 地 址 。 在 这 一 节 中 ， 为 简单 起 见 ， 我 们 将 假设 对 于 所 有 的 中 斯 只 存在 一 个 地 址 为 0x20 的 中 
断 向 量 IVECT， 该 向 量 必须 用 中 断 服 务 程 序 的 地 址 来 进行 初始 化 。 

图 4-4 显示 了 一 个 使 用 中 断 来 从 键盘 上 读 取 字符 的 汇编 语言 程序 。 主 程序 将 中 断 服务 程 
序 的 地 址 装 入 IVECT 单元 中 ， 并 将 键盘 接口 中 控制 寄存 器 的 KIN 位 置 为 1， 同时 将 处 理 器 中 
IENABLE 和 PS 寄存 器 的 中 断 允 许 位 也 置 为 1。 在 每 一 次 键盘 中 断 时 ， 中 断 服务 程序 就 读 取 输 
入 字符 ， 并 将 其 发 送 到 显示 器 上 。 

现在 考虑 使 用 C 语言 来 实现 该 IO 任务 。 像 C 这 样 的 高 级 语言 是 不 能 直接 处 理 诸如 中 断 
之 类 的 硬件 功能 的 。 编 写 使 用 中 断 的 C 程序 我 们 需要 解决 如 下 两 个 问题 : 


IVECT EQU 
KBD DATA EQU 
KBD_STATUS EQU 
KBD CONT EQU 
DISP DATA EQU 
DISP_STATUS EQU 


Move 

Move 
StoreByte 
Move 

Move 

Store 

Move 
MoveControl 
Move 
MoveControl 

LOOP: Branch 


中 断 服务 程序 

INTSERYV: Subtract 
Store 
Store 
Move 
LoadByte 
Move 
StoreByte 
Load 
Load 
Add 


0x20 

Ox4000 
Ox4004 
Ox4008 
Ox4010 
Ox4014 
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中 断 服 务 程序 向 量 

键盘 数据 寄存 器 (8 位 ) 

键盘 状态 寄存 器 ( 第 一 位 是 KIN 标志 ) 
键盘 控制 寄存 器 (第 一 位 是 KIE 标志 ) 
显示 器 数据 寄存 器 (8 位 ) 

显示 器 状态 寄存 器 ( 第 二 位 是 DOUT 标志 ) 


R2, #KBD_DATA ”键盘 接口 指针 


R3, #0x2 

R3, 8(R2) 

R2, #IVECT 
R3, #INTSERV 
R3, (R2) 

R2, #0x2 
IENABLE, R2 
R2, #0x1 

PS, R2 

LOOP 


SP SP, #8 
R2, 4(SP) 
R3, (SP) 


配置 键盘 以 产生 中 断 

向 量 指针 

中 断 服务 程序 的 开始 
设置 中 断 向 量 

允许 处 理 器 识别 键盘 中 断 


为 处 理 器 设置 中 断 允许 位 
连续 等 待 循环 


保存 寄存 器 


R2, #KBD_DATA ”键盘 接口 指针 


R3, (R2) 


读 取 下 一 个 字符 


R2, #DISP_DATA ”显示 器 接口 指针 


R3, (R2) 
R2, 4(SP) 
R3, (SP) 
SP, SP, #8 


Return-from-interrupt 





将 接收 到 的 字符 写 人 显示 器 
恢复 寄存 器 


图 4-4 ”使 用 中 断 传输 字符 的 汇编 语言 程序 
e 如 何 访问 处 理 器 控制 寄存 器 ? 


e 如 何 编写 中 断 服务 程序 ? 


中 断 方 法 的 初始 化 要 求 设 置 [ENABLE 和 PS 寄存 器 中 的 控制 位 。 图 4-3 所 示 的 基于 指针 
的 方法 可 用 于 访问 存储 器 映射 IO 寄存 器 ， 但 不 能 用 于 访问 控制 寄存 器 IENABLE 和 PS， 因 为 
这 两 个 寄存 器 没有 地 址 。 相 反 ， 可 以 通过 在 C 程序 中 直接 嵌入 适当 的 汇编 语言 指令 来 访问 这 
些 寄存 器 。 我 们 可 通过 一 个 特殊 的 指示 符 来 告知 编译 器 实现 此 功能 。 例 如 ， 语 名 


的 是 ， 编 译 器 提供 了 更 复杂 的 方法 来 管理 


asm ("MoveControl PS, R2 ); 
使 得 C 编译 器 将 引号 之 间 的 汇编 语言 指令 插 
人 到 编译 后 的 代码 中 。 由 于 寄存 器 R2 可 能 
已 经 被 编译 器 生成 的 指令 所 使 用 ， 所 以 任何 
插 人 的 汇编 语言 指令 都 不 能 破坏 它 的 内 容 。 
一 个 简单 的 解决 方法 是 在 R2 被 MoveControl 
指令 使 用 并 修改 前 将 R2 的 内 容 保 存 到 堆栈 
中 ， 然 后 在 该 指令 结束 后 再 将 它们 恢复 。 本 
例 中 我 们 将 使 用 这 种 方法 。 但 是 ， 应 该 注意 


#define KBD_DAIA (volatile char *) Ox4000 
#define DISP_DATA (volatile char *) Ox4010 


void main() 


{ 


} 


void intservO 


*DISP_DATA = *KBD_DATA;， /# 传输 一 个 字符 */ 
} 


图 4-5 在 C 程序 中 将 中 断 服务 程序 表示 为 函数 
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asm 指示 符 中 所 指定 的 寄存 器 的 使 用 方法 。 

第 二 个 问题 是 中 断 服务 程序 。C 语言 中 需要 将 该 中 断 服 务 程序 编写 为 一 个 函数 。 然 而 ， 编 
译 器 会 将 所 有 的 C 函数 实现 为 以 Return-from-subroutine ( 从 子 程序 返回 ) 指令 结束 的 子 程序 。 
图 4-5 给 出 了 一 个 例子 。 主 函数 中 执行 了 一 些 未 指定 的 任务 。 名 为 intserv 的 函数 将 一 个 字符 从 
键盘 传送 到 显示 器 。 函 数 intserv 经 过 编译 后 生成 的 代码 为 : 

< 保存 寄存 器 > 

LoadByte R2, 0x4000(R0) 

StoreByte R2, 0x4010(RO) 

< 恢复 寄存 器 > 

Return-from-subroutine 
因为 VO 寄存 器 的 地 址 在 16 位 以 内 ， 所 以 编译 器 可 以 使 用 绝对 寻 址 方式 ， 如 2.4.3 节 所 讨论 
的 ， 寄 存 器 R0 始终 包含 值 0。 

为 了 将 intserv 函数 当 作 中 断 服务 程序 使 用 ， 它 必须 以 Return-from-interrupt 指令 结束 。 这 
条 指令 用 来 将 程序 计数 器 和 处 理 器 状态 寄存 器 的 内 容 恢复 到 它们 在 中 断 发 生 之 前 的 值 。 我 们 可 
以 通过 使 用 语句 

asm ("Return-from-interrupt"); 

在 程序 中 插入 Return-from-interrupt 指令 作为 intserv 函数 的 最 后 一 个 语句 。 使 用 该 语句 ， 函 数 
编译 后 的 代码 为 : 

< 保存 寄存 器 > 

LoadByte R2, 0x4000(RO) 

StoreByte R2, 0x4010(RO) 

Return-from-interrupt 

< 恢复 寄存 器 > 

Return-from-subroutine 
如 同 对 所 有 的 函数 那样 ， 编 译 器 还 是 在 末尾 包含 了 恢复 寄存 器 的 代码 和 Return-from-subroutine 
指令 。 然 而 ， 编 译 器 在 函数 中 包含 Return-from-interrupt 指令 意味 着 在 其 之 后 的 代码 将 永远 不 
会 被 执行 。 因 为 中 断 可 以 在 程序 中 的 任何 位 置 发生 ， 所 以 如 果 不 能 成 功 地 对 在 函数 中 修改 过 的 
寄存 器 恢复 其 原始 值 的 话 ， 会 导致 程序 的 后 续 执 行 出 错 。 更 关键 的 是 ， 如 果 不 能 恢复 堆栈 指针 
的 正确 值 的 话 ， 会 导致 戏 套 子 程序 的 堆栈 帧 被 破坏 。 

有 两 种 方法 可 以 在 高 级 语言 (如 C ) 中 正确 地 支持 中 断 。 第 一 种 方法 需要 扩展 高 级 语言 的 
语法 ， 增 加 一 个 可 以 标识 出 中 断 服 务 程序 的 特殊 关键 字 。 例 如 ，C 编译 器 可 能 会 识别 出 在 函数 
定义 开始 处 的 interrupt 关键 字 ， 比 如 将 图 4-5 中 的 函数 改写 为 : 

interrupt void intserv() {*……} 
该 关键 字 指 示 编 译 器 将 Return-from-subroutine 指令 用 Return-from-interrupt 指令 替换 。 寄 存 器 
还 是 像 以 前 一 样 被 保存 和 恢复 。 但 是 ， 不 是 所 有 的 C 编译 器 都 提供 这 种 功能 。 

第 二 种 方法 是 使 用 汇编 语言 来 编写 中 断 处 理 程序 并 使 用 连接 程序 将 其 连接 到 C 程序 中 。 
这 种 情况 下 ， 中 断 处 理 程序 必须 首先 保存 链接 寄存 器 的 值 ， 因 为 主 程序 调用 一 个 子 程序 后 可 能 
会 产生 中 断 。 在 保存 了 链接 寄存 器 的 值 之 后 ， 中 断 处 理 程序 可 以 调用 一 个 C 语言 子 程序 来 提 
供 中 断 服 务 。 这 样 的 话 ， 在 高 级 语言 源 程序 中 就 不 需要 特殊 的 关键 字 了 。 从 子 程序 返回 后 ， 中 
断 处 理 程序 恢复 链接 寄存 器 的 值 并 执行 Return-from-interrupt 指令 。 

现在 我 们 可 以 编写 一 个 使 用 中 断 来 从 键盘 发 送 字符 到 显示 器 的 C 程序 了 。 图 4-6 给 出 了 
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一 个 等 同 于 图 4-4 的 程序 。 我 们 使 用 了 基于 C 编译 器 中 特殊 关键 字 的 方法 ， 因 为 它 允 许 整 个 程 
序 都 在 单独 的 一 个 高 级 语言 源 文件 中 。 注 意 ， 存 储 器 映射 VO 寄存 器 的 指针 是 字符 类 型 的 ， 因 
为 它们 指向 与 设备 接口 中 8 位 寄存 器 相对 应 的 单元 。 指 针 IVECT 是 无 符号 整数 类 型 的 ， 因 为 
它 指 向 一 个 存储 4 字 节 中 断 向 量 的 存储 单元 。 


#define IVECT 

#define KBD_ DATA 
#define KBD_ CONT 
#define DISP_DATA 
#define DISP_STATUS 


interrupt void intserv(); 


void main() 


(volatile unsigned int *) Ox20 
(volatile char *) Ox4000 
(volatile char *) Ox4008 
(volatile char *) Ox4010 
(volatile char *) Ox4014 


必 前 置 声明 */ 


{ 
/* 基于 中 断 的 字符 传输 的 初始 化 */ 


*KBD_CONT = 0x2; 


* 允许 键盘 中 断 */ 


*IVECT = (unsigned int) &intserv; /#* 设置 中 断 向 量 */ 

asm ("Subtract SP, SP #4"); 放 保存 寄存 器 R2 */ 
asm("Store  R2, (SP)"); 

asm ("Move  R2,#0x2"); 启 允许 处 理 器 识别 键盘 中 断 */ 


asm ("MoveControl 


IENABLE, R2 ); 


asm ("Move R2,#0x1"); 人 # 允许 处 理 器 中 断 */ 


asm ("MoveControl 


PS, R2"); 


asm ("Load  R2, (SP)"); /#* 恢复 寄存 器 R2*/ 
asm ("Add SP, SP #4"); 


while (1) 


放 连续 循环 */ 


懂 使 用 中 断 服务 程序 传输 字符 */ 


interrupt void intserv() ”/* 关键 字 指 示 编 译 器 将 防 数 当 作 中 断 程序 */ 
{ 


*DISP_DATA = *KBD_DATA;， /* 传输 一 个 字符 */ 
/* 编译 器 将 在 函数 末尾 插入 Retum-from-interrupt 指令 */ 


} 





图 4-6 使 用 中 断 实 现 字 符 传输 的 C 程序 


4.9 操作 系统 


前 面 几 节 描述 了 如 何在 多 个 实用 程序 的 帮助 下 准备 及 执行 应 用 程序 。 操 作 系 统 ( operating 
system，OS ) 将 使 本 章 中 描述 的 所 有 任务 都 可 以 很 方便 地 实现 ， 它 是 大 多 数 计算 机 中 一 个 关键 
的 软件 组 件 ， 负 责 协调 计算 机 中 的 所 有 活动 。 操 作 系 统 通常 包含 一 些 常 驻 内 存 的 基本 例 程 ， 以 
及 存储 在 磁盘 上 、 在 需要 的 时 候 会 被 加 载 到 存储 器 中 执行 的 各 种 实用 程序 。 

在 程序 执行 期 间 ， 操 作 系统 管理 计算 机 的 处 理 、 存 储 器 及 输入 /输出 资源 。 它 可 以 解释 用 
户 的 命令 、 分 配 内 存 和 磁盘 空间 、 在 内 存 和 磁盘 之 间 传 送信 息 、 处 理 IO 操作 等 。 它 还 可 以 使 
用 户 使 用 文本 编辑 器 、 编 译 器 、 汇 编程 序 和 连接 程序 来 准备 应 用 程序 。 装 载 程序 通常 是 操作 系 
统 的 一 部 分 ， 当 用 户 输入 执行 一 个 应 用 程序 的 命令 时 装载 程序 将 被 调用 。 在 这 一 节 中 ,我 们 的 
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目标 是 对 操作 系统 所 执行 的 重要 功能 进行 一 个 基本 的 描述 。 更 深入 的 讨论 超出 了 本 书 的 范围 
(参见 参考 文献 [1] )。 


4.9.1 引导 程序 


通用 计算 机 的 操作 系统 是 一 个 很 大 且 很 复杂 的 软件 集合 。 操 作 系 统 的 所 有 部 分 ， 包 括 常 
驻 内 存 的 部 分 ， 通 常 都 被 存储 在 磁盘 上 。 引 导 程 序 (boot-strapping process ) 是 用 来 将 操作 系统 中 
常 驻 内 存 的 部 分 加 载 到 内 存 中 ， 使 操作 系统 可 以 开始 执行 ， 并 对 计算 机 的 资源 进行 控制 管理 。 

当 打开 计算 机 的 时 候 ， 引 导 程 序 开 始 工 作 ， 处 理 器 从 一 个 预定 的 单元 提取 第 一 条 指令 。 
那个 单元 必须 在 内 存 的 一 个 永久 部 分 中 ， 在 关闭 计算 机 的 时 候 也 能 保留 其 内 容 。 放 置 在 该 单元 
的 一 个 小 程序 使 得 处 理 器 能 够 将 操作 系统 中 更 大 的 部 分 逐渐 从 磁盘 传送 到 内 存 的 非 永久 部 分 
中 。 在 这 个 引导 序列 中 执行 的 每 个 程序 将 操作 系统 的 更 多 部 分 从 磁盘 传送 到 内 存 中 ， 并 对 计算 
机 内 存 和 LO 设备 进行 必要 的 初始 化 。 最 后 ， 装 载 程序 和 操作 系统 中 负责 处 理 用 户 命令 的 部 分 
被 传送 到 内 存 中 。 这 使 得 操作 系统 可 以 开始 接收 命令 来 加 载 并 执行 存储 在 磁盘 文件 中 的 应 用 程 
序 了 。 


4.9.2 管理 应 用 程序 的 执行 


为 了 理解 操作 系统 的 基本 原理 ， 我 们 来 讨论 一 下 一 台 由 处 理 器 及 键盘 、 显 示 器 、 磁 盘 和 
打印 机 等 IO 设备 组 成 的 计算 机 。 我们 首先 讨论 一 个 应 用 程序 的 运行 步 又。 然后， 再 探讨 操作 
系统 是 如 何 管理 多 个 应 用 程序 的 执行 的 。 

为 了 执行 一 个 存储 在 磁盘 文件 中 的 应 用 程序 ， 用 户 输入 一 个 命令 使 得 装载 程序 将 该 文件 传 
输 到 内 存 中 。 当 传输 结束 后 ， 程 序 开始 执行 。 假 定 该 程序 的 任务 包括 将 一 个 数据 文件 从 磁盘 读 
取 到 内 存 中 ， 对 数据 进行 某 些 计算 后 再 打印 结果 。 当 程序 执行 到 某 处 需要 读 取 数据 文件 时 ， 它 
请 求 操作 系统 来 将 数据 文件 从 磁盘 传送 到 内 存 。 数 据 传 送 完毕 后 ， 操 作 系统 将 执行 控制 权 传 回 
给 应 用 程序 ， 应 用 程序 继续 执行 所 需 的 计算 。 当 计算 完成 后 ， 存 储 在 内 存 中 的 结果 已 经 准备 就 
绪 等 待 打印 ， 应 用 程序 再 发 送 一 个 请 求 给 操作 系统 。 然 后 执行 一 个 操作 系统 例 程 来 打印 结果 。 


打印 机 


磁盘 


程序 





to a 12 13 14 15 


时 间 
图 4-7 用 户 程 序 与 操作 系统 例 程 间 转 换 执行 控制 权 的 时 间 线 
执行 控制 权 在 应 用 程序 和 操作 系统 例 程 之 间 来 回 传递 ， 它 们 共享 处 理 器 来 执行 各 自 的 任 
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务 。 说明 此 活动 的 一 种 简便 方法 是 使 用 时 线 图 ， 如 图 4-7 所 示 。 在 到 时 间 段 中 ， 装 载 程序 
将 目标 程序 从 磁盘 传送 到 内 存 ; 在 4 时刻 ， 操 作 系 统 将 执行 控制 权 传递 给 应 用 程序 ， 然 后 应 用 
程序 开始 运行 直到 它 需 要 读 取 磁盘 上 的 数据 ; 在 4 到 4 时 间 段 中 ， 操 作 系 统 传输 所 请 求 的 数 
据 ; 最 后 ， 在 4 到 4s 时间 段 中 ,操作 系 统 打 印 存储 在 内 存 中 的 运算 结果 

计算 机 的 资源 在 同时 执行 多 个 应 用 程序 时 可 以 被 更 高 效 地 利用 。 注 意 , 图 4-7 中 4 到 i 
时 间 段 的 大 部 分 时 间 磁 盘 和 处 理 器 都 处 于 闲置 状态 。 如 果 在 此 期 间 允 许 用 户 输入 命令 ， 则 操作 
系统 可 以 在 打印 机 进行 打印 的 时 候 装 载 并 开始 执行 男 一 个 应 用 程序 。 当 两 个 程序 不 竞争 访问 计 
算 机 中 的 同一 资源 时 ， 它 们 的 计算 过 程 和 IO 请 求 是 并 行 处 理 的 。 操 作 系 统 负责 管理 几 个 应 用 
程序 的 并 行 执行 ， 以 尽 可 能 地 充分 利用 计算 机 的 所 有 资源 。 这 种 并 行 执 行 的 方法 被 称 为 多 道 程 
序 ( multiprogram ) 或 多 任务 ( multitask )， 在 这 种 操作 模式 中 ， 处 理 右 以 交错 的 时 间 顺 序 来 执 
行 多 个 程序 ， 并 与 不 同 VO 设备 执行 的 任务 重合 执行 。 


4.9.3 中 断 在 操作 系统 中 的 使 用 


操作 系统 在 执行 VO 操作 、 与 程序 通信 和 控制 程序 执行 时 大 量 地 使 用 了 中 断 。 中 断 机 制 使 
操作 系统 可 以 分 配 优先 级 、 从 一 个 程序 切换 到 男 一 个 程序 、 终 止 程序 、 实 现 安全 和 保护 功能 以 
及 协调 IO 活动 等 。 我 们 将 简单 讨论 一 下 这 些 方面 的 内 容 ， 以 说 明 如 何 使 用 中 断 。 

操作 系统 将 所 有 与 计算 机 相连 的 并 且 可 以 发 出 中 断 的 设备 的 中 断 服务 程序 组 织 在 一 起 。 
在 一 台 安 装 了 操作 系统 的 通用 计算 机 中 ， 应 用 程序 本 身 并 不 直接 执行 VO 操作 。 当 应 用 程序 需 
要 进行 输入 或 输出 操作 时 ， 它 指向 需要 传输 的 数据 ， 并 请 求 操作 系统 来 执行 该 操作 。 应 用 程序 
的 请 求 通常 是 通过 一 个 库 子 程序 发 出 软件 中 断 并 进入 操作 系统 例 程 来 完成 的 。 操 作 系 统 暂 停 执 
行 发 出 请 求 的 程序 ， 然 后 开始 执行 所 请 求 的 IO 操作 。 当 LO 操作 结束 后 ， 通 常 通过 一 个 硬件 
中 断 来 告知 操作 系统 这 一 状况 。 然 后 操作 系统 允许 暂停 的 程序 继续 执行 。 操 作 系统 和 应 用 程序 
之 间 的 控制 权 传 递 是 使 用 软件 中 断 来 实现 的 。 

操作 系统 为 应 用 程序 提供 各 种 各 样 的 应 用 服务 。 为 了 便于 实现 这 些 服务 ， 处 理 器 可 能 有 
几 条 不 同 的 软件 中 断 指令 ， 其 中 每 一 条 都 有 自己 的 中 断 向 量 。 根 据 所 请 求 的 服务 ， 它 们 可 以 被 
用 来 调用 操作 系统 的 不 同 部 分 。 或 者 ， 处 理 器 可 能 只 有 一 条 软件 中 断 指 令 ， 该 指令 用 一 个 立即 
操作 数 来 指明 所 需 的 服务 。 

操作 系统 必须 确保 应 用 程序 的 执行 能 正确 地 终止 。 在 应 用 程序 的 末尾 执行 一 条 适当 的 软 
件 中 断 指 令 可 以 告知 操作 系统 获取 控制 权 并 终止 程序 。 你 应 该 还 记得 ， 在 目标 程序 的 头 部 包含 
了 程序 在 内 存 中 的 起 始 地 址 和 长 度 等 有 关 信 息 。 操 作 系 统 可 以 使 用 这 些 信息 来 回收 分 配给 程序 
的 空间 ， 然 后 再 将 回收 的 空间 用 于 其 他 应 用 程序 。 

为 了 实现 多 任务 ， 操 作 系 统 需要 在 任何 时 候 都 能 接收 用 户 的 新 命令 。 当 发 出 请 求 的 程序 
所 需要 的 所 有 资源 都 可 用 时 ， 操 作 系 统 装载 并 开始 执行 该 程序 。 

多 任务 示例 

为 了 说 明 应 用 程序 和 操作 系统 之 间 的 相互 作用 ， 我 们 来 看 一 个 多 任务 的 例子 。 实 现 多 任 
务 的 一 种 常见 技术 被 称 为 时 间 片 技术 (time slice )。 每 个 程序 只 运行 一 段 很 短 的 时 间 +t， 称 为 时 
间 片 ， 然 后 另 一 个 程序 接着 运行 它 的 时 间 片 ， 如 此 继续 下 去 。 周 期 + 由 连续 运行 的 硬件 定时 器 
确定 ， 这 个 定时 器 每 r 秒 钟 产 生 一 个 中 断 。 

图 4-8 描述 了 在 多 任务 环境 下 实现 一 些 基 本 功能 所 需 的 例 程 。 操 作 系 统 启动 时 要 执行 一 
个 初始 化 例 程 ， 在 图 4-8a 中 称 为 OSINIT。 此 外 ,初始 化 例 程 还 对 存储 器 中 的 中 断 向 量 区 域 





145 


进行 设置 。 写 人 到 向 量 区 域 的 值 对 应 于 不 同 中 断 的 中 断 服务 程序 起 始 地 址 。 例 如 ，OSINIT 将 
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_SCHEDULER 例 程 的 起 始 地 址 装 人 定时 器 中 断 的 中 断 向 量 中 。 因 此 ， 在 每 个 时 间 片 结束 时 ， 
定时 器 中 断 将 执行 该 例 程 。 


设置 中 断 向 量 
定时 器 中 断 < SCHEDULER 
软件 中 断 二 OSSERVICES 
IO 中 断 < IODATA 


OSSERVICES 检查 堆栈 或 处 理 器 寄存 器 以 确定 所 请 求 的 操作 


调用 适当 的 例 程 
SCHEDULER 保存 当前 运行 进程 的 程序 状态 
选择 另 一 个 就 绪 进程 
作 复 新 尝 进 各 以 前 保存 的 和 序 状 





a ) 操作 系统 初始 化 、 服 务 程序 和 调度 程序 


设置 请 求 进程 的 状态 为 阻塞 状态 
初始 化 内 存 缓冲 区 地 址 指针 和 计数 器 
调用 设备 驱动 来 初始 化 设备 ， 并 在 设备 接口 中 允许 中 断 


从 子 程序 返回 


轮 询 设备 ， 

调用 适当 的 驱动 程 
如 果 END=1， 则 设置 IO 阻塞 进程 的 状态 为 就 绪 状 态 
中 断 返 回 





b ) LO 例 程 


KBDINIT 允许 中 断 
从 子 程序 返回 


KBDDATA ”检查 设备 状态 


如 果 准 备 就 绪 便 传输 字符 
如 果 字 符 =CR， 则 { 设置 END=1; 禁止 中 断 }， 和 否则 设置 END=0 
Return from subroutine: 从 子 程序 返回 





c ) 键盘 驱动 程序 
图 4-8 操作 系统 例 程 示 例 


将 程序 与 所 有 描述 其 当前 执行 状态 的 信息 视 为 一 个 整体 ， 称 为 进程 (process)。 一 个 进程 可 
以 处 于 以 下 三 种 状态 之 一 : 运行 、 就 绪 和 阻塞 。 运 行 状态 指 的 是 程序 当前 正在 被 执行 。 如 果 程 
序 已 经 准备 好 并 且 在 等 待 被 选 定 执行 ， 那 么 此 时 进程 就 处 于 就 绪 状 态 。 第 三 种 状态 ， 阻 寨 ， 指 
的 是 程序 因为 一 一 些 原因 而 没有 准备 好 开始 执行 。 比 如 ， 它 可 能 正在 等 待 之 前 所 请 求 的 VO 操作 
的 完成 。 

假设 程序 A 在 一 个 给 定 的 时 间 片 内 处 于 运行 状态 。 在 该 时 间 片 结束 时 ， 定 时 器 中 断 这 个 
程序 的 运行 并 开始 执行 SCHEDULER。SCHEDULER 是 一 个 操作 系统 例 程 ， 它 决定 哪个 用 户 
程序 在 下 个 时 间 片 运行 。 该 例 程 首先 保存 以 后 继续 执行 程序 A 所 需要 的 全 部 信息 。 这 些 保存 
的 信息 包括 程序 计数 器 和 处 理 器 状态 寄存 器 等 一 些 寄存 器 的 内 容 。 必 须 保存 寄存 器 的 内 容 是 因 
为 中 断 发 生 时 它们 可 能 包含 一 些 正 在 进行 的 计算 的 中 间 结 果 。 程序 计数 器 指向 以 后 可 以 继续 执 
行 的 位 置 。 处 理 器 状态 寄存 器 反映 了 当前 的 程序 状态 。 

然后 ，SCHEDULER 选择 执行 男 一 程序 B， 程 序 B 在 早 些 时 候 被 暂停 并 且 正 处 于 就 绪 状 
态 。SCHEDULER 将 程序 B 暂停 时 保存 的 所 有 信息 恢复 ,包括 程序 计数 器 和 状态 寄存 器 的 内 


容 ， 然 后 执行 一 条 中 断 返 回 指令 。 于 是 ， 程 序 B 就 重新 开始 执行 + 秒 钟 ， 在 这 个 时 间 片 结束 时 
定时 器 再 次 产生 一 个 中 断 ， 并 发 生 到 另 一 个 就 绪 进 程 的 上 下 文 切 换 (context switch )。 

假设 程序 A 当前 正在 执行 ， 并 且 需 要 从 键盘 读 和 人 一行 字符 。 它 并 不 亲自 执行 这 个 操作 ， 
而 是 向 操作 系统 请 求 1/O 服务 。 它 使 用 堆栈 或 处 理 器 寄存 器 向 操作 系统 传递 信息 来 描述 请 求 的 
操作 、1/O 设备 和 程序 数据 区 域 中 用 来 存放 从 键盘 输入 字符 的 缓冲 区 地 址 。 然 后 它 发 出 一 个 软 
件 中 断 ， 相 应 的 中 断 向 量 指向 图 4-8a 中 的 OSSERVICES 例 程 。OSSERVICES 例 程 检查 堆栈 或 
寄存 器 中 的 信息 并 调用 适当 的 操作 系统 例 程 来 启动 请 求 的 操作 。 在 此 例 中 ， 它 调用 图 4-8b 中 
的 IOINIT 例 程 ， 它 是 一 个 负责 启动 VO 操作 的 通用 例 程 。 

当 进 行 IO 操作 时 ， 请 求 该 操作 的 程序 不 能 继续 执行 。 因 此 ，IOINIT 例 程 将 与 程序 A 相 
关联 的 进程 设置 成 阻塞 状态 。IOINIT 例 程 执 行 TO 操作 需要 的 所 有 准备 工作 ， 如 初始 化 地 址 指 
针 和 字 节 计数 ， 然 后 调用 一 个 例 程 对 请 求 IO 操作 的 特定 设备 进行 初始 化 。 

设计 操作 系统 时 通常 将 属于 特定 IO 设备 的 所 有 软件 封装 成 一 个 独立 的 模块 ， 称 为 设备 
驱动 程序 (device driver )。 这 样 的 模块 可 以 很 容易 地 添加 到 操作 系统 中 或 从 操作 系统 中 删除 。 
我 们 假设 键盘 的 设备 驱动 程序 由 两 个 例 程 组 成 : KBDINIT 和 KBDDAIA， 如 图 4-8c 所 示 。 
IOINIT 例 程 调用 KBDINIT，KBDINIT 用 来 执行 设备 或 其 接口 电路 所 需要 的 初始 化 操作 ， 同 时 
KBDINIT 还 在 接口 电路 中 设置 控制 寄存 器 的 相应 位 来 允许 中 断 ， 然 后 返回 到 IOINIT，IOINIT 
再 返回 到 OSSERVICES。 至 此 键盘 接口 已 准备 好 参与 数据 传输 操作 了 。 每 当 一 个 键 被 按 下 时 ， 
它 就 产生 一 个 中 断 请 求 。 

返回 到 OSSERVICES 后 ，SCHEDULER 例 程 选择 另 一 个 用 户 程序 运行 。 当 然 ， 调 度 例 程 
不 会 选择 程序 A， 因 为 它 已 经 请 求 了 一 个 IO 操作 ， 现 正 处 于 阻塞 状态 。 而 是 会 选择 程序 B 或 


其 他 处 于 就 绪 状态 的 程序 。 中 断 返 回 指令 不 仅 能 使 被 选 定 的 用 户 程序 开始 执行 ， 同 时 还 因为 将 


处 理 器 状态 寄存 器 恢复 为 原来 保存 的 内 容 而 重新 允许 处 理 器 中断 。 这 样 ， 由 键盘 接口 产生 的 中 
断 请 求 将 被 接受 ， 该 中 断 的 中 断 向 量 指向 一 个 称 为 IODATA 的 操作 系统 例 程 。 因 为 可 能 会 有 

台 设 备 请 求 中 断 ， 所 以 IODATA 首先 测试 这 些 设备 ， 以 识别 出 请 求 服务 的 设备 ， 然 后 调用 
适当 的 设备 驱动 程序 来 为 该 请 求 服务 。 在 我 们 的 例子 中 ， 所 调用 的 驱动 程序 是 KBDDATA， 
它 将 传输 一 个 字符 的 数据 。 如 果 是 回 车 符 ， 它 还 将 END 标志 置 为 1 来 通知 IODATA 所 请 求 
的 IO 操作 已 经 完成 。 同 时 ，IODATA 例 程 将 进程 A 的 状态 由 阻塞 变 为 就 纤 ， 从 而 调度 例 程 便 
可 以 在 将 来 的 某 个 时 间 片 中 选择 进程 A 执行 。 


4.10 结束语 


软件 是 决定 一 台 计 算 机 的 通用 性 和 实用 性 的 关键 因素 。 实 用 程序 使 得 用 户 可 以 创建 、 执 
行 和 调试 应 用 软件 。 程 序 员 可 以 通过 编译 器 、 汇 编程 序 和 连接 程序 来 灵活 地 组 合 高 级 语言 源 文 
件 、 汇 编 语 言 源 文件 和 库 文件 ， 以 生成 目标 程序 。 必 要 时 ， 还 可 以 在 高 级 语言 源 文件 中 嵌入 汇 
编 语 言 指令 。 

操作 系统 软件 大 大 增强 了 计算 机 的 功能 ， 它 可 以 管理 和 协调 所 有 的 活动 。 操 作 系统 的 多 
任务 处 理 使 得 多 个 应 用 程序 可 以 并 行 执行 不 同 的 活动 ， 因 而 能 够 充分 地 利用 计算 机 。 


习题 
[E] 4.1 编写 一 个 C 程序 实现 习题 3.2 中 描述 的 任务 。 


[M] 4.2 编写 一 个 C 程序 实现 习题 3.9 中 描述 的 任务 。 
[M] 4.3 编写 一 个 C 程序 实现 习题 3.13 中 描述 的 任务 。 
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[D] 4.4 编写 一 个 C 程序 实现 习题 3.15 中 描述 的 任务 。 

[D] 4.5 编写 一 个 C 程序 实现 习题 3.17 中 描述 的 任务 。 

[D] 4.6 编写 一 个 C 程序 实现 习题 3.17 中 描述 的 任务 ， 使 用 与 定时 器 相关 的 中 断 服务 程序 。 

[D] 4.7 假定 处 理 器 的 指令 集 包含 指令 

MultiplyAccumulate Ri Rj, Rk 

它 使 用 处 理 器 寄存 器 Ri、Rj 和 Rk 来 执行 Ri + 一 [Ri] + [Ri x [RN 操作 。 这 条 指令 在 2.12.1 节 中 
描述 过 。 
假定 编译 器 在 生成 汇编 语言 输出 的 时 候 不 使 用 这 条 指令 ， 且 在 C 程序 中 定义 了 X、Y 和 Z 三 个 
全 局 变量 。 用 C 语言 编写 一 个 mult_acc_XYZ 函数 ， 使 用 MultiplyAccumnulate 指令 来 计算 X = 
X+Y x Z。 注 意 ， 该 函数 和 调用 程序 经 过 编译 器 编译 后 生成 的 汇编 语言 指令 可 能 会 使 用 处 理 器 
寄存 器 来 保存 数据 。 

[D] 4.8 4.9.2 节 讨 论 了 图 4-7 所 示 的 一 系列 程序 的 输入 和 输出 步骤 是 如 何 重 和 至 执行 以 减少 总 的 执行 时 间 
的 ， 设 6 个 操作 系统 例 程 中 每 一 个 的 执行 时 间 是 1 个 单位 的 时 间 ， 每 个 磁盘 操作 需要 3 个 单位 的 
时 间 ， 打 印 需要 3 个 单位 的 时 间 ， 每 个 程序 的 执行 需要 2 个 单位 的 时 间 。 计 算 这 一 系列 程序 的 最 
佳 重 倒 时 间 与 非 重 又 时 间 的 比率 。 忽 略 启动 和 结束 的 时 间 。 

[D] 4.9 4.9.2 节 指 明 程 序 计 算 可 与 输入 或 输出 操作 或 两 者 重 登 起 来 。 忽 略 执行 操作 系统 例 程 所 需 的 相对 
较 短 的 运行 时 间 ， 为 完成 一 系列 程序 的 执行 ， 最 佳 重 秋 时间 与 非 重 释 时 间 的 比率 是 多 少 ? 其 中 每 
个 程序 的 输入 、 计 算 和 输出 活动 都 大 致 均衡 。 

[M] 4.10 在 4.9.3 节 对 进程 三 种 状态 的 讨论 中 ， 我 们 描 “ 述 了 从 就 绪 到 运行 、 就 绪 到 阻塞 、 阻 塞 到 就 绪 的 状 
态 转换 。 这 些 状 态 间 还 有 哪些 直接 的 转换 是 可 能 的 ? 哪些 是 不 可 能 的 ? 请 简 述 原因 。 
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本 章 目 标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 处 理 器 如 何 执行 指令 

e 处 理 器 的 功能 部 件 以 及 这 些 部 件 如 何 互 连 

e 用 于 产生 控制 信号 的 硬件 

e 微 程 序 控制 

在 本 章 中 我 们 将 主要 讨论 处 理 部 件 ， 该 部 件 的 主要 功能 是 执行 机 器 语言 指令 以 及 协调 计 
算 机 中 其 他 部 件 的 活动 。 我 们 将 查看 其 内 部 结构 ， 并 说 明 它 是 如 何 完成 指令 的 读 取 、 译 码 和 
执行 的 。 该 处 理 部 件 通 常 称 为 中 央 处 理 器 (CPU )。 因 为 现在 的 计算 机 通常 包含 多 个 处 理 部 
件 ， 所 以 跟 过 去 相 比 ,“ 中 央 ” 一 词 在 今天 就 有 些 从 妥 了 。 我 们 将 在 本 章 的 讨论 中 使 用 处 理 器 
( processor ) 一 词 。 

随 着 技术 的 不 断 发 展 以 及 人 们 对 计算 机 性 能 要 求 的 不 断 提 高 ， 处 理 器 的 结构 多 年 来 也 在 
不 断 地 发 生变 化 。 为 了 实现 更 高 的 性 能 ， 一 个 明智 的 做 法 就 是 使 处 理 器 的 各 种 功能 部 件 尽 可 能 
地 并 行 操作 。 这 种 处 理 器 一 般 都 含有 流水 线 (pipeline ) 结构 ， 这 使 得 处 理 器 可 以 在 前 一 条 指 
令 执 行 结 束 之 前 就 开始 执行 下 一 条 指令 。 另 外 一 种 方法 称 为 超标 量 (superscalar ) 操作 ， 可 以 
同时 读 取 并 开始 执行 多 条 指令 。 我 们 将 在 第 6 章 中 讨论 流水 线 以 及 超标 量 方法 。 本 章 将 主要 对 
各 种 处 理 器 都 通用 的 基本 思想 进行 讨论 。 


5.1 一 些 基本 概念 
一 个 典型 的 计算 任务 是 由 构成 程序 的 机 器 语言 指令 序列 所 指定 的 一 系列 操作 组 成 的 。 处 
理 器 每 次 取出 一 条 指令 并 执行 指定 的 操作 。 除 非 遇 到 转移 指令 或 跳 转 指令 ， 否 则 指令 都 从 连续 
的 存储 单元 读 取 。 处 理 器 使 用 程序 计数 器 (Program Counter，PC ) 来 跟踪 将 要 取出 和 执行 的 下 
一 条 指令 的 地 址 。 取 出 指令 以 后 ，PC 的 内 容 将 被 更 新 以 指向 序列 中 的 下 一 条 指令 。 而 转移 指 
令 则 可 能 会 将 一 个 不 同 的 值 装 入 PC 中 。 
当 一 条 指令 被 取出 时 ， 它 被 处 理 器 的 控制 电路 放置 在 指令 寄存 器 ( Instruction Register， 
IR ) 中 ， 指 令 就 是 在 人 R 中 被 解释 或 译 码 的 。IR 将 一 直 保存 该 指令 直到 它 执 行 完毕 。 
例如 ， 一 台 32 位 的 计算 机 ， 它 的 每 条 指令 都 被 包含 在 存储 器 的 一 个 字 中 ， 就 像 RISC 风 
格 的 指令 集体 系 结构 那样 。 为 了 执行 一 条 指令 ， 处 理 器 必须 执行 以 下 步骤 : 
1) 取出 PC 指向 的 存储 单元 的 内 容 。 该 单元 中 的 内 容 是 将 要 执行 的 指令 ， 因 此 它们 被 装 
入 IR 中 。 这 个 动作 使 用 寄存 器 传输 符号 形式 可 以 表示 为 : 
IR ~ [[PC]] 
2 ) 递增 PC 的 值 使 其 指向 下 一 条 指令 。 假 设 存储 器 是 按 字 节 寻 址 的 ， 那么 PC 就 增加 4， 即 
PC < [PC]+4 
3 ) 执行 IR 中 指令 所 指定 的 操作 。 
取出 一 条 指令 并 将 其 装 和 IR 通常 称 为 取 指 令 阶段 (instruction fetch phase )， 执 行 指令 所 
指定 的 操作 称 为 指令 执行 阶段 ( instruction execution phase )。 
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除了 少数 例外 情况 ， 指 令 所 指定 的 操作 都 可 以 通过 执行 以 下 一 个 或 多 个 动作 来 实现 : 
。 读 取 给 定 存储 单元 的 内 容 ， 并 将 其 装 人 处 理 器 寄存 器 中 。 
。 从 一 个 或 多 个 处 理 器 寄存 器 中 读 取 数据 。 
。 执行 算术 或 逻辑 运算 ， 并 将 运算 结果 放 到 处 理 器 寄存 器 中 。 
。 将 处 理 器 寄存 器 中 的 数据 保存 到 指定 的 存储 单元 中 。 
执行 这 些 动作 所 需 的 硬件 组 件 如 图 5-1 所 示 。 处 理 
器 通过 “处 理 器 -存储 器 ”接口 与 存储 器 进行 通信 ， 该 
接口 在 读 和 写 操作 期 间 从 存储 器 接收 数据 或 向 存储 器 传 寄存 器 
送 数据 。 每 条 指令 取出 以 后 ， 指 令 地 址 发 生 器 都 会 更 新 
PC 的 内 容 。 寄 存 器 文件 是 一 个 存储 器 部 件 ， 它 的 存储 单 
元 被 组 织 成 为 处 理 器 的 通用 寄存 器 。 在 执行 过 程 中 ， 算 


术 或 逻辑 运算 指令 所 指定 的 寄存 器 的 内 容 被 发 送 到 算术 
逻辑 部 件 (ALU )， 由 ALU 执行 所 需 的 计算 。 计 算 结 果 \»/ 
则 存储 在 寄存 器 文件 中 的 一 个 寄存 器 中 。 


在 我 们 深入 研究 这 些 部 件 以 及 它们 之 间 的 相互 关系 
之 前 ， 了 解 一 下 数据 处 理 系统 的 总 体 结构 是 很 有 帮助 的 。 
数据 处 理 硬 件 “处 理 器 -存储 器 ”接口 

一 个 典型 的 计算 会 对 存储 在 寄存 器 中 的 数据 进行 操 
作 。 组 合 电路 ( 如 加 法 器 ) 对 这 些 数据 进行 处 理 ， 并 将 。 时! 处 理 器 的 主要 硬件 组 件 
结果 放 到 一 个 寄存 器 中 。 图 5-2 说 明了 这 种 结构 。 这 里 ， 我 们 使 用 一 个 时 钟 信号 来 控制 数据 传 
输 的 时 序 。 寄 存 器 由 边沿 触发 的 触发 器 构成 ， 新 数据 就 是 在 时 钟 的 工作 沿 被 装 入 的 。 在 本 章 
中 ， 我 们 假定 时 钟 的 上 升 沿 为 工作 沿 。 时 钟 周期 是 指 两 个 连续 的 上 升 沿 之 间 的 时 间 ， 它 必须 足 
够 长 以 确保 组 合 电路 产生 正确 的 结果 。 
寄存 器 阶段 A 寄存 器 阶段 B 








时 钟 


图 5-2 数据 处 理 的 基本 结构 


图 5-2 中 的 组 合 模 块 所 执行 的 操作 可 能 会 相当 复杂 。 通 常 ， 我 们 可 以 把 这 个 操作 分 解 成 几 
个 简单 的 步骤 ， 其中， 每 个 步骤 都 是 由 原始 电路 的 一 个 子 电 路 去 完成 的 。 然 后 ， 这 些 子 电路 可 
以 级 联 起 来 形成 一 个 多 阶段 结构 ， 如 图 5-3 所 示 。 那 么 ， 如 果 使 用 n 个 阶段 的 结构 ， 则 完成 一 
个 操作 需要 n 个 时 钟 周 期 。 由 于 这 些 组 合子 电路 比 原始 电路 小 得 多 ， 它 们 可 以 用 较 少 的 时 间 完 
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成 其 操作 ， 因 此 可 以 使 用 更 短 的 时 钟 周期 。 多 阶段 结构 的 一 个 主要 优势 在 于 它 适合 流水 线 操 
作 ， 这 将 在 第 6 章 中 讨论 。 这 种 结构 特别 适用 于 实现 RISC 风格 指令 集 的 处 理 器 。 在 本 章 的 其 
余部 分 ， 我 们 将 主要 讨论 使 用 这 种 多 阶段 结构 的 处 理 器 。 在 5.7 节 中 ， 我 们 还 将 介绍 一 种 适合 
于 CISC 风格 处 理 器 的 更 加 传统 的 方法 。 

寄存 器 阶段 A 寄存 器 阶段 B 


阶段 2 


1 

| 

阶段 1 阶段 3 | 
1 





时 钟 
图 5-3 具有 多 个 阶段 的 硬件 结构 


5.2 ”指令 的 执行 
现在 ， 让 我 们 来 查看 一 下 取出 及 执行 指令 时 所 涉及 的 动作 。 我 们 将 用 几 条 有 代表 性 的 
RISC 风格 的 指令 来 具体 说 明 这 些 动 作 。 


5.2.1 Load 指令 
考虑 下 面 的 指令 : 
Load RS,X(R7) 
它 使 用 变 址 寻 址 方式 来 将 存储 单元 X + [R7] 中 一 个 字 长 的 数据 装 入 寄存 器 R5 中 。 执 行 这 条 指 
邻 包括 以 下 几 个 动作 : 
e 从 存储 器 中 取出 指令 。 
e 递增 程序 计数 器 的 值 。 
e 对 指令 进行 译 码 以 确定 将 要 执行 的 操作 。 
e 读 取 寄存 器 R7。 
e 将 立即 值 X 与 R7 的 内 容 相 加 。 
e 将 X+[R7] 的 结果 作为 源 操 作 数 的 有 效 地 址 ， 并 读 取 存储 器 中 相应 单元 的 内 容 。 
e 将 从 存储 器 中 读 取 的 数据 装 人 目的 寄存 器 R5 中 。 155 
根据 硬件 的 组 织 方式 ， 上 述 动作 中 有 一 些 是 可 以 在 同一 时 间 执 行 的 。 在 接 下 来 的 讨论 中 ， 
我 们 假设 处 理 器 有 5 个 硬件 阶段 ， 这 是 RISC 风格 的 处 理 器 常用 的 结构 。 每 条 指令 的 执行 分 为 
5 步 ， 这 样 ， 每 一 步 可 由 一 个 硬件 阶段 完成 。 在 这 种 情况 下 ， 上 述 Load 指令 的 读 取 及 执行 就 
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可 以 按 如 下 步骤 完成 : 
1 ) 取出 指令 并 递增 程序 计数 器 的 值 。 
2 ) 对 指令 进行 译 码 并 从 寄存 器 文件 中 读 取 寄存 器 R7 的 内 容 。 
3 ) 计算 有 效 地 址 。 
4 ) 读 取 存储 器 中 的 源 操作 数 。 
5 ) 将 操作 数 装 入 目的 寄存 器 Rs 中 。 


5.2.2 算术 及 逻辑 运算 指令 

涉及 算术 或 逻辑 运算 的 指令 可 以 使 用 类 似 的 步 又 执行 。 它 们 与 Load 指令 的 不 同 之 处 在 于 
以 下 两 个 方面 : 

e。 有 两 个 源 寄 存 器 ， 或 者 有 一 个 源 寄存 器 以 及 一 个 立即 源 操 作 数 。 

e 不 需要 访问 存储 器 操作 数 。 

这 种 类 型 的 典型 指令 是 : 

Add R3,R4,R5 

完成 该 指令 需要 以 下 几 个 步骤 : 

1 ) 取出 指令 并 递增 程序 计数 器 的 值 。 

2 ) 对 指令 进行 译 码 并 读 取 源 寄存 器 R4 和 Rs 的 内 容 。 

3 ) 计算 和 : [R4] + [R5]。 

4 ) 将 计算 结果 装 人 目的 寄存 器 R3 中 。 
由 于 Add 指令 并 不 需要 访问 存储 器 中 的 操作 数 ， 因 此 可 以 在 四 个 步 又 内 完成 ， 而 不 像 Load 指 
令 那样 需 要 五 个 步 又 。 然 而 ， 在 下 一 章 中 我 们 将 会 看 到 ， 对 尽 可 能 多 的 指令 使 用 相同 的 多 阶段 
处 理 硬 件 是 非常 有 利 的 。 要 做 到 这 一 点 ， 我 们 需要 使 每 一 条 指令 的 执行 都 花费 相同 的 步骤 数 。 
为 此 ， 以 Load 指令 的 执行 步骤 为 模板 ， 需 要 将 Add 指令 的 执行 扩展 为 五 个 步 又。 由 于 Add 指 
令 不 需要 访问 存储 器 操作 数 ， 所 以 我 们 可 以 在 步骤 3 与 步骤 4 之 间 插 和 人 一 个 不 发 生 任 何 动作 的 
空 步 又。 这样，Add 指令 就 将 按 如 下 步骤 执行 : 

1 ) 取出 指令 并 递增 程序 计数 器 的 值 。 

2 ) 对 指令 进行 译 码 并 读 取 源 寄存 器 R4 和 Rs5 的 内 容 。 

3 ) 计算 和 : [R4] + [R5]。 

4 ) 空 操作 。 

5 ) 将 计算 结果 装 入 目的 寄存 器 R3 中 。 
如 果 指 令 使 用 一 个 立即 操作 数 ， 如 指令 

Add R3,R4,#1000 

在 指令 中 给 出 了 立即 值 。 一 旦 该 指令 被 装 入 IR 中 ,立即 值 就 可 以 用 于 加 法 运算 中 了 。 这 样 就 
同样 可 以 使 用 上 述 五 步 动 作 ， 其 中 ， 步 又 2 和 步骤 3 修改 为 : 

2 ) 对 指令 进行 译 码 并 读 取 寄存 器 R4 的 内 容 。 

3 ) 计算 和 : [R4] + 1000。 
5.2.3 Store 指令 

用 于 Load 指令 以 及 Add 指令 的 五 步 动作 也 同样 适用 于 Store 指令 ， 只 是 最 后 一 步 将 结果 


装 入 目的 寄存 器 是 不 需要 的 。 负 责 这 一 步 的 硬件 阶段 不 执行 任何 动作 。 例 如 ， 指 令 
Store R6, X(R8) 
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将 寄存 器 R6 的 内 容 存 储 到 存储 单元 X + [R8] 中 。 其 实现 步骤 如 下 : 

1 ) 取出 指令 并 递增 程序 计数 器 的 值 。 

2 ) 对 指令 进行 译 码 并 读 取 寄存 器 R6 和 R8 的 内 容 。 

3 ) 计算 有 效 地 址 : X+ [R8]。 

4 ) 将 寄存 器 R6 的 内 容 存 人 存储 单元 X+[R8] 中 。 

5 ) 空 操作 。 

在 第 2 步 读 取 寄 存 器 R8 的 内 容 之 后 ， 第 3 步 中 使 用 指令 寄存 器 I 中 的 立即 值 X 计算 存 
储 器 地 址 。 在 第 4 步 中 ，R6 的 内 容 被 发 送 到 存储 器 中 存储 。 第 5 步 不 执行 任何 动作 。 

总 之 ， 图 5-4 所 示 的 
五 步 动作 序列 对 RISC 风格 


取出 指令 并 递增 程序 计数 器 的 值 





指令 集中 的 所 有 指令 都 适 对 指令 进行 译 码 并 从 寄存 器 文件 中 读 取 寄 存 器 的 内 容 
用 。 正 如 我 们 在 第 2 章 中 ee th 
所 提 到 的 ，RISC 风格 的 指 如 果 指令 包含 存储 器 操作 数 ， 则 对 存储 器 数据 进行 读 或 写 操作 
令 为 一 个 字 长 ， 而 且 只 有 如 果 需要 ， 将 结果 写 人 日 的 寄存 器 
Load 指令 和 Store 指令 才 - i 
图 5-4 取出 并 执行 指令 的 五 步 动作 序列 
会 访问 存储 器 中 的 操作 数 。 
其 他 执行 计算 的 指令 所 使 用 的 数据 不 是 存储 在 通用 寄存 器 中 ， 就 是 在 指令 中 以 立即 数 的 形式 
给 出 。 


上 述 这 五 步 动 作 序列 适用 于 所 有 的 Load 和 Store 指令 ， 这 是 因为 这 些 指令 中 使 用 的 寻 址 
方式 都 是 变 址 方式 的 特殊 情况 。 大 多 数 RISC 风格 的 处 理 器 都 会 提供 一 个 通用 寄存 器 ， 通 常 是 
R0， 其 中 总 是 包含 数值 0。 当 把 RO 用 作 变 址 寄存 器 时 ， 操 作 数 的 有 效 地 址 就 是 立即 值 X， 这 
就 相当 于 绝对 寻 址 方式 。 另 外 ， 如 果 把 偏 移 量 X 设 为 0， 那么 有 效 地址 就 是 变 址 寄存 器 Ri 中 
的 内 容 ， 这 就 相当 于 间接 寻 址 方式 。 因 此 ， 只 需要 实现 一 种 寻 址 方式 ， 即 变 址 方式 。 这 样 ， 就 
显著 地 简化 了 处 理 器 的 硬件 。 选 择 RO 为 变 址 寄存 器 或 者 将 X 设 为 0 的 任务 是 由 汇编 程序 或 纺 
译 器 来 完成 的 。 这 与 RISC 的 理念 是 一 致 的 ， 即 以 更 高 的 编译 器 复杂 度 和 更 长 的 编译 时 间 为 代 
价 来 换取 硬件 的 简单 和 快速 。 由 于 程序 的 执行 往往 要 比 程 序 的 编译 频繁 得 多 ， 所 以 这 样 做 的 结 
果 就 是 节省 了 在 计算 机 上 执行 各 种 任务 所 需 的 总 时 间 。 


5.3 ”硬件 组 件 


上 述 的 讨论 表明 ， 我 们 可 以 使 用 图 5-4 中 的 五 步 动 作 序列 来 执行 RISC 风格 处 理 器 的 所 有 
指令 。 因 此 ， 可 以 把 处 理 器 的 硬件 组 织 成 五 个 阶段 ， 每 个 阶段 负责 执行 一 个 步骤 所 需 的 动作 。 
现在 我 们 将 研究 图 5-1 中 的 组 件 ， 并 解释 它们 是 如 何 被 组 织 成 图 5-3 的 多 阶段 结构 的 。 


5.3.1 寄存 器 文件 


寄存 器 文件 是 一 个 小 型 而 快速 的 存储 区 。 通 常情 况 下 ， 通 用 寄存 器 是 以 寄存 器 文件 的 方 
式 实 现 的 。 寄 存 器 文件 包含 了 一 组 存储 元 件 ， 以 及 可 以 使 数据 被 读 出 或 写 人 任何 寄存 器 的 接 人 
电路 。 接 人 电路 的 设计 使 其 可 以 同时 读 取 两 个 不 同 的 寄存 器 ， 并 令 它 们 的 内 容 出 现在 两 个 独立 
的 输出 端 A 和 B 上 。 寄 存 器 文件 有 两 个 地 址 输入 端 ， 可 以 选择 两 个 寄存 器 进行 读 取 。 这 些 输 
和 信 端 与 IR 中 指定 源 寄存 器 的 字段 相连 接 ， 以 便 读 取 所 需 的 寄存 器 。 寄 存 器 文件 还 有 一 个 数据 
输入 端 C 以 及 一 个 对 应 的 地 址 输入 端 ， 这 个 地 址 输入 端 用 来 选择 将 被 写 人 数据 的 寄存 器 ， 并 
与 IR 中 指定 目的 寄存 器 的 字段 相连 接 。 
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通常 ， 我 们 把 任何 存储 器 部 件 的 输入 和 输出 称 为 输入 和 输出 端口 (port )。 一 个 拥有 两 个 
输出 端口 的 存储 器 部 件 被 称 为 是 双 端 口 (dual-ported ) 的 。 图 5-5 显示 了 实现 双 端 口 寄存 器 文 
件 的 两 种 方式 。 一 种 方式 是 只 使 用 一 组 寄存 器 ， 利 用 双重 的 数据 通路 以 及 接 人 电路 ， 实 现在 同 
一 时 间 读 取 两 个 寄存 器 的 内 容 。 另 一 种 方式 则 是 用 两 个 存储 区 ， 每 个 存储 区 包含 寄存 器 文件 的 
一 个 副本 。 每 当 要 向 一 个 寄存 器 写 人 数据 时 ， 就 将 数据 写 人 该 寄存 器 的 两 个 副本 中 。 因 此 ， 这 
两 个 文件 的 内 容 是 完全 相同 的 。 当 一 条 指令 需要 读 取 两 个 寄存 器 中 的 数据 时 ， 就 可 以 在 每 个 文 
件 中 访问 一 个 寄存 器 。 实 际 上 ， 这 两 个 寄存 器 文件 一 起 充当 了 一 个 单独 的 双 端 口 寄存 器 文件 。 

输入 数据 地 址 C 


输入 数据 


地 址 C 





输出 数据 输出 数据 
a ) 单一 存储 区 b ) 两 个 存储 区 
图 5-5” 双 端口 寄存 器 文件 的 两 种 实现 方式 


5.3.2 ALU 


算术 逻辑 部 件 用 于 操纵 数据 。 它 可 以 执行 加 
法 和 减法 等 算术 运算 ， 也 可 以 执行 AND (与 )、 
OR (或 ) 和 XOR ( 异 或 ) 等 逻辑 运算 。 从 概念 
上 讲 ， 寄 存 器 文件 和 ALU 可 以 按 图 5-6 所 示 的 方 
式 连 接 起 来 。 当 要 执行 一 条 算术 或 逻辑 运算 指令 
时 ,就 从 寄存 器 文件 中 读 出 指令 中 所 指定 的 两 个 
寄存 器 的 内 容 ， 并 使 其 出 现在 输出 端 A 和 B 上 。 
输出 端 A 与 ALU 的 第 一 个 输入 端 InA 直接 相连 ， 
输出 端 B 则 连接 到 多 路 复 用 器 MuxB 上 。 多 路 复 
用 器 选择 寄存 器 文件 的 输出 端 B 或 者 天 中 的 立 
即 值 ， 并 将 其 连接 到 ALU 的 第 二 个 输入 端 InB 
上 。ALU 的 输出 端 与 寄存 器 文件 的 数据 输入 端 C 
相连 ， 以 便 可 以 将 计算 结果 装 人 目的 寄存 器 中 。 


5.3.3 ”数据 通路 
指令 处 理 包 括 两 个 阶段 : 取 指 令 阶 段 和 执行 图 5-6 计算 所 需 硬件 的 概念 视图 
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阶段 。 所 以 把 处 理 器 硬件 划分 为 两 个 相应 的 部 分 会 很 方便 。 其 中 一 个 部 分 负责 取 指 令 ， 男 一 个 
部 分 则 负责 执行 指令 。 取 指令 的 部 分 同时 也 负责 对 指令 进 .i 
行 译 码 ， 并 负责 为 执行 阶段 将 发 生 的 相应 动作 生成 控制 信 
号 。 执 行 部 分 读 取 指 令 中 指定 的 数据 操作 数 ， 执 行 所 需 的 
计算 , 并 存储 结果 。 

现在 ， 我 们 需要 将 硬件 组 织 成 一 个 类 似 于 图 5-3 中 的 
多 阶段 结构 ， 其 中 的 五 个 阶段 分 别 与 图 5-4 中 的 五 个 步骤 
相对 应 。 图 5-7 给 出 了 一 种 可 能 的 结构 。 这 五 个 阶段 中 每 
个 阶段 所 执行 的 动作 都 要 在 一 个 时 钟 周期 内 完成 。 硬 件 阶 
段 1 在 第 1 步 中 取出 一 条 指令 并 将 其 放 入 IR 中 。 在 第 2 步 
中 ， 该 指令 被 译 码 ， 并 读 取 其 源 寄存 器 的 内 容 。IR 中 的 信 -|-------- 
息 被 用 来 为 后 续 的 步骤 生成 控制 信号 。 因 此 ，IR 必须 一 直 
保存 该 指令 直到 它 执行 完毕 。 

我 们 还 需要 在 相 邻 阶段 之 间 插 入 一 些 寄 存 器 。 这 些 段 
间 寄 存 器 保存 相应 阶段 产生 的 结果 ， 这 样 ， 在 下 一 个 时 钟 
周期 中 ， 它 们 可 被 用 作 下 一 阶段 的 输入 。 这 就 引出 了 图 5-8 
的 结构 。 该 图 中 的 硬件 通常 被 称 为 数据 通路 (datapath )。 -pp 
它 对 应 于 图 5-7 中 的 第 2 到 第 5 阶段 。 从 寄存 器 文件 中 读 图 5-7 一 个 五 阶段 的 结构 
取 的 数据 被 放置 到 寄存 器 RA 和 RB 中 。 寄 存 器 RA 为 ALU 的 输入 端 InA 提供 数据 。 多 路 复 
用 器 MuxB 则 将 寄存 器 RB 中 的 内 容 或 者 IR 中 的 立即 值 转发 给 ALU 的 第 二 输入 端 mB。ALU 
构成 第 3 阶段 ， 其 计算 结果 被 放置 到 寄存 器 RZ 中 。 

回想 一 下 之 前 的 计算 型 指令 ， 如 Add 指令 ， 在 第 4 步 中 没有 发 生 任何 处 理 动作 。 在 这 一 
步 中 ， 图 5-8 中 的 多 路 复 用 器 MuxY 选择 寄存 器 RZ 以 将 计算 结果 传送 给 RY。 在 第 5 步 中 ， 
RY 中 的 内 容 被 传送 给 寄存 器 文件 ， 并 被 装 入 目的 寄存 器 中 。 为 此 ， 寄 存 器 文件 同 处 于 第 2 和 
第 5 阶段 。 说 它 是 第 2 阶段 的 一 部 分 是 因为 它 包 含 了 源 寄存 器 ， 而 说 它 是 第 5 阶段 的 一 部 分 则 
是 因为 它 包含 了 目的 寄存 器 。 

对 于 Load 和 Store 指令 而 言 ，ALU 在 第 3 步 中 计算 出 存储 器 操作 数 的 有 效 地 址 并 将 其 
装 人 寄存 器 RZ 中 。 在 第 4 阶段 ， 该 地 址 从 RZ 发 送 至 存储 器 。 对 于 Load 指令 ， 多 路 复 用 器 
MuxY 选择 从 存储 器 中 读 取 的 数据 并 将 其 放置 在 寄存 器 RY 中 ， 以 便 在 下 一 个 时 钟 周期 将 其 传 
送 给 寄存 器 文件 。 对 于 Store 指令 来 说 ， 数 据 是 在 第 2 阶段 从 寄存 器 文件 中 读 出 的 并 被 放置 到 
寄存 器 RB 中 。 由 于 存储 器 访问 是 在 第 4 阶段 进行 的 ， 所 以 需要 在 多 阶段 结构 中 增加 一 个 段 间 
寄存 器 以 保持 数据 流 的 正确 性 。 引 入 寄存 器 RM 就 是 出 于 这 个 目的 。 在 第 3 步 中 ， 将 需要 存储 
的 数据 从 RB 移 到 RM 中 ， 继 而 在 第 4 步 中 再 将 其 存 人 存储 器 中 。 在 这 种 情况 下 ， 第 5 步 无 需 
采取 任何 动作 。 

2.7 节 中 介绍 的 子 程序 调用 指令 把 返回 地 址 保存 在 一 个 通用 寄存 器 中 ,为 了 便于 引用 ,我 
们 称 之 为 LINK。 类 似 地 ，3.2 节 中 描述 的 中 断 处 理 也 需要 保存 返回 地 址 。 假 设 我 们 为 此 使 用 了 
男 一 个 通用 寄存 器 IRA。 这 两 个 动作 都 要 求 将 程序 计数 器 的 内 容 发 送 到 寄存 器 文件 中 。 为 此 ， 
多 路 复 用 器 MuxY 就 有 了 第 三 个 输入 端 ， 通 过 该 输入 端 就 可 以 将 返回 地 址 传送 至 寄存 器 RY 
中 ， 然 后 再 从 RY 发 送 到 寄存 器 文件 中 。 其 中 ， 返 回 地 址 是 由 指令 地 址 发 生 器 产生 的 ， 稍 后 我 
们 将 进行 讲解 。 


第 2 阶段 


第 3 阶段 






第 4 阶段 


第 5 阶段 
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第 3 阶段 
存储 器 地 址 
存储 器 数据 

第 4 阶段 返回 地 址 

第 5 阶段 

| 
图 5-8 处理 器 中 的 数据 通路 
5.3.4 取 指 令 部 分 


图 5-9 给 出 了 处 理 器 中 取 指 令 部 分 的 组 织 结构 。 在 取 指 令 时 ， 访 问 存储 器 的 地 址 来 自 于 程 
序 计数 器 PC ; 而 在 访问 指令 操作 数 时 ， 访 问 存 储 器 的 地 址 则 来 自 于 数据 通路 中 的 寄存 器 RZ。 
多 路 复 用 器 MuxMA 会 选择 其 中 的 一 个 并 将 其 发 送 到 “处 理 器 -存储 器 ”接口 。PC 被 包含 在 
一 个 更 大 的 模块 一 一 指令 地 址 发 生 器 中 ， 该 发 生 器 会 在 取出 每 条 指令 后 对 PC 的 内 容 进行 更 
新 。 从 存储 器 中 读 取 的 指令 被 装 人 IR 中 ，IR 会 一 直 保 存 该 指令 直到 其 执行 完毕 并 且 下 一 条 指 
令 被 取出 。 

控制 电路 可 以 通过 检查 IR 的 内 容 来 生成 控制 处 理 器 所 有 硬件 所 需 的 信号 。 被 标记 为 立即 
数 的 模块 也 会 用 到 IR 的 内 容 。 正 如 第 2 章 所 述 ， 一 些 指令 中 可 能 会 包含 立即 值 。16 位 的 立即 
值 会 被 扩展 为 32 位 ， 然 后 ， 扩 展 值 可 以 直接 作为 操作 数 使 用 ， 也 可 以 用 来 计算 操作 数 的 有 效 
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地 址 。 对 于 一 些 指令 ,例如 执行 算术 运算 的 指令 ， 立 即 值 是 用 符号 扩展 的 ; 而 对 于 其 他 的 指令 ， 
例如 逻辑 运算 指令 ， 立 即 值 则 是 用 零 来 填充 的 。 图 5-9 中 的 立即 数 模块 负责 生成 扩展 值 ， 并 将 
其 转发 给 图 5-8 中 的 多 路 复 用 器 MuxB， 以 使 在 ALU 计算 中 使 用 。 同 时 它 生成 的 扩展 值 也 可 
用 于 计算 转移 指令 的 目标 地 址 。 
寄存 器 文件 
(经 RA) (经 RB) 











立即 值 
4 ( 转移 偏 移 量 ) 





控制 电路 





(扩展 至 32 位 ea 
立即 值 返回 地 址 ) 
的 立即 值 存储 器 数据 存储 器 地 址 
图 5-9 图 5-7 的 取 指 令 部 分 图 5-10 ”指令 地 址 发 生 器 


地 址 发 生 器 的 电路 如 图 5-10 所 示 。 在 程序 的 线性 执行 ( 无 跳 转 ) 过 程 中 ， 加 法 器 用 于 将 
PC 的 值 递 增 4。 当 执行 转移 指令 和 子 程序 调用 指令 时 ， 它 也 可 以 用 于 计算 一 个 将 要 被 装 和 人 PC 
中 的 新 值 。 加 法 器 的 一 个 输入 端 与 PC 相连 ， 另 一 个 输入 端 则 连 到 多 路 复 用 器 MuxINC 上 ， 该 
多 路 复 用 器 选择 将 常数 4 或 者 转移 偏 移 量 加 到 PC 上 。 转 移 偏 移 量 是 由 IR 中 的 立即 数字 段 给 
出 的 ， 并 且 被 图 5-9 中 的 立即 数 模块 符号 扩展 为 32 位 。 加 法 器 的 输出 通过 第 二 个 多 路 复 用 器 
MuxPC 传送 到 PC 中 ， 多 路 复 用 器 MuxPC 在 加 法 器 的 输出 和 寄存 器 RA 的 输出 之 间 进 行 选择 ， 
后 者 在 执行 子 程序 链接 指令 时 用 到 。 在 保存 子 程序 或 中 断 的 返回 地 址 的 过 程 中 ， 我 们 需要 用 寄 
存 器 PC-Temp 来 临时 存放 PC 的 内 容 。 


5.4 ”指令 的 读 取 和 执行 步骤 

现在 我 们 利用 图 5-8 中 的 数据 通路 对 取 指 令 和 执行 指令 的 过 程 进行 更 深入 的 研究 。 再 次 考 
虑 指令 

Add R3,R4,R5 

图 5-11 给 出 了 读 取 和 执行 该 指令 的 步 又。 假设 我 们 用 图 2-32 ( 此 处 复制 为 图 5-12 ) 中 的 格式 
对 该 指令 进行 编码 。 在 从 存储 器 中 取出 该 指令 并 将 其 放 人 到 IR 后 ， 源 寄存 器 地 址 就 在 IRi -> 
和 IRzx-> 字段 中 了 。 这 两 个 字段 与 寄存 器 文件 中 端口 A 和 B 的 地 址 输入 端 相连 。 因 此 ， 在 第 
2 步 的 末尾 ， 可 以 去 读 取 寄 存 器 R4 和 Rs 的 内 容 并 将 其 分 别 装 入 寄存 器 RA 和 RB 中 。 在 下 一 
步 中 ， 控 制 电 路 通过 设置 MuxB 来 选择 输入 端 0， 从 而 将 寄存 器 RB 连接 到 ALU 的 输入 端 InB 
上 。 同 时 ， 这 也 使 得 ALU 执行 加 法 运算 。 由 于 寄存 器 RA 与 输入 端 InA 相连 接 ， 所 以 ALU 就 
会 产生 [RA] + [RB] 的 和 ， 并 在 第 3 步 未 尾 将 结果 装 入 寄存 器 RZ 中 。 

在 第 4 步 中 ， 多 路 复 用 器 MuxY 选择 输入 端 0， 从 而 使 得 寄存 器 RZ 的 内 容 被 传送 到 RY 
中 。 控 制 电路 则 将 Add 指令 的 目标 地 址 字段 IR_vy 连接 到 寄存 器 文件 端口 C 的 地 址 输入 端 上 。 
在 第 5 步 中 ， 控 制 电路 向 寄存 器 文件 发 送 一 个 Write 命令 ， 使 得 寄存 器 RY 的 内 容 被 写 入 到 寄 
存 器 R3 中 。 
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存储 器 地 址 二 [PC] , 读 取 存储 器 IR < 存储 器 数据 PC < [PC]+4 
对 指令 进行 译 码 ，RA < [R4]，RB < [R5] 


RZ < [RA] + [RB] 
RY < [RZ] 
R3 < [RY] 


图 5-11 读 取 和 执行 指令 Add R3, R4, R5 所 需 的 动作 序列 





27 26 22 21 17 16 0 


(a ) 寄存 器 -操作 数 格式 
31 27 26 22 21 6 5 0 


(b ) 立即 数 - 操作 数 格式 


31 6 5 0 
(c ) 调用 格式 


图 5-12 ”指令 编码 格式 


动作 
存储 器 地 址 <- [PC]， 读 取 存 储 器 ，IR 全 存储 器 数据 PC < [PC] +4 
对 指令 进行 译 码 ，RA < [R7] 


RZ < [RA] + 立即 值 X 
存储 器 地 址 二 [RZ], 读 取 存储 器 ，RY < 存储 器 数据 
R5 < [RY] 


图 5-13” 读 取 并 执行 指令 Load R5, X(R7) 所 需 的 动作 序列 





动作 
存储 器 地 址 二 [PC], 读 取 存储 器 ， 食 < 存储 器 数据 ，PC < [PC] + 4 
对 指令 进行 译 码 ，RA < 二 [R8]，RB < [R6] 


RZ < [RA] + 立即 值 X，RM < [RB] 
存储 器 地 址 < [RZ], 读 取 存储 器 二 [RM], 写 人 存储 器 
空 操作 





图 5-14 读 取 并 执行 指令 Store R6, X(R8) 所 需 的 动作 序列 


Load 和 Store 指令 都 以 类 似 的 方式 执行 。 在 这 种 情况 下 ， 字 段 IRz6-z2 给 出 了 目的 寄存 
器 的 地 址 。 控 制 硬件 把 该 字段 连接 到 寄存 器 文件 输入 端 C 相对 应 的 地 址 输入 端 。 图 5-13 和 
图 5-14 给 出 了 这 些 指令 执行 的 步骤 。 这 两 个 例子 中 ， 存 储 器 地 址 都 以 变 址 方式 指定 ， 其 中 变 
址 值 X 是 在 指令 中 以 立即 值 的 方式 给 出 的 。 在 第 3 步 中 ，MuxB 选择 IR 中 的 立即 数字 段 ， 由 
图 5-9 中 的 立即 数 模 块 进行 适当 扩展 后 ， 再 与 寄存 器 RA 的 内 容 相 加 ， 所 得 到 的 和 就 是 操作 数 
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的 有 效 地 址 。 

一 些 需要 注意 的 问题 

在 上 述 的 讨论 中 ,我 们 假设 存储 器 读 写 操 作 可 以 在 一 个 时 钟 周期 内 完成 。 问 题 是 ， 这 个 
假设 现实 吗 ? 一 般 而 言 ， 对 计算 机 主 存储 器 进行 访问 所 需 的 时 间 要 远 远 超过 对 寄存 器 文件 中 寄 
存 器 的 内 容 进 行 读 取 的 时 间 。 然 而 ， 大 多 数 现代 处 理 器 都 使 用 高 速 缓存 ， 我 们 将 在 第 8 章 中 详 
细 讨 论 高 速 缓存 。 高 速 缓存 比 主 存储 器 要 快 得 多 。 它 通常 与 处 理 器 放 在 同一 芯片 上 ， 这 使 得 它 
可 以 达到 与 寄存 器 文件 相当 的 速度 。 因 此 ， 当 所 需 数据 存放 在 高 速 缓存 中 时 ， 存 储 器 的 读 或 写 
操作 就 可 以 在 一 个 时 钟 周期 内 完成 。 当 一 个 操作 需要 访问 主 存储 器 时 ， 处 理 器 必须 等 待 该 操作 
完成 。 我 们 将 在 5.4.2 节 中 讨论 如 何 处 理 速度 较 慢 的 存储 器 访问 。 

在 第 2 步 中 我 们 还 假设 处 理 器 会 读 取 指 令 中 的 源 寄存 器 ， 然 而 那 时 处 理 器 仍然 在 对 刚 被 
装 入 IR 中 的 指令 的 操作 码 进行 译 码 。 这 两 个 操作 可 能 在 同一 步 中 完成 吗 ? 在 指令 译 码 完成 之 
前 ， 控 制 硬 件 又 如 何 知 道 要 去 读 取 哪 个 寄存 器 ? 其 实 这 是 可 以 做 到 的 ， 因 为 在 所 有 的 指令 中 ， 
源 寄存 器 的 地 址 都 是 由 相同 的 位 位 置 指定 的 。 一 旦 指令 被 装 入 IR 中 ， 硬 件 就 会 读 取 由 这 些 位 
位 置 中 的 地 址 所 指定 的 寄存 器 。 它 们 的 内 容 在 第 2 步 末 尾 被 装 入 寄存 器 RA 和 RB 中 。 如 
果 指 令 需要 这 些 数据 ， 就 可 以 在 第 3 步 中 使 用 它们 。 和 否则 ， 后 续 的 硬件 阶段 将 会 忽略 这 些 
数据 。 

需要 注意 的 是 ,图 5-11 、 图 5-13 和 图 5-14 描述 的 动作 并 没有 说 明 在 任何 情况 下 都 需要 在 
第 2 步 中 读 取 两 个 寄存 器 。 为 了 避免 混淆 ， 即 使 总 是 要 读 取 两 个 寄存 器 ， 也 只 有 图 中 所 描述 的 
特定 指令 所 需要 的 寄存 器 才 会 被 提 及 。 


5.4.1 转移 

在 程序 的 线性 执行 过 程 中 ， 指 令 是 从 存储 器 的 连续 字 单 元 中 取出 的 。 每 取出 一 条 指令 ， 
处 理 器 就 将 程序 计数 器 PC 递增 4 以 指向 下 一 个 字 。 这 种 执行 方式 继续 下 去 ， 直 到 转移 指令 或 
子 程序 调用 指令 将 一 个 新 的 地 址 装 入 PC 中 。 其 中 ， 子 程序 调用 指令 需要 保存 返回 地 址 ， 以 便 
于 其 返回 到 调用 程序 时 使 用 。 这 一 节 ， 我 们 就 来 研究 实现 这 些 指 令 所 需要 的 动作 。IO 设备 以 
及 软件 中 断 指令 引起 的 中 断 都 以 类 似 的 方式 处 理 。 

转移 指令 指定 了 相对 于 PC 的 转移 目标 地 址 。 在 指令 中 ， 以 立即 值 形式 给 出 的 转移 偏 移 量 
被 加 到 PC 的 当前 内 容 中 。 表 示 该 偏 移 量 的 位 数 比 计算 机 的 字 长 要 少 得 多 ， 这 是 因为 指令 中 还 
需要 空间 来 指定 操作 码 以 及 转移 条 件 。 因 此 ， 一 条 转移 指令 能 够 到 达 的 地 址 范围 是 有 限 的 。 

子 程序 调用 指令 可 以 到 达 更 大 的 地 址 范围 ， 这 是 因为 这 些 指令 中 没有 包含 条 件 ， 这 样 就 
可 以 使 用 更 多 的 位 来 指定 目标 地 址 。 此 外 ， 大 多 数 RISC 风格 的 计算 机 中 都 有 Jump 和 Call 指 
令 ， 它们 使 用 一 个 通用 寄存 器 来 指定 一 个 完整 的 32 位 地 址 。 正 如 附录 B 到 E 中 所 介绍 的 处 理 
器 示例 那样 ， 每 一 台 计 算 机 的 具体 细节 都 有 所 不 同 。 

1.， 转移 指令 

图 5-15 给 出 了 实现 无 条 件 转移 指令 的 步骤 序列 。 和 之 前 一 样 ， 在 第 1 步 中 取出 指令 并 将 
PC 的 值 递增 。 在 第 2 步 中 ， 指 令 被 译 码 之 后 ， 多 路 复 用 器 MuxINC 在 第 3 步 选 择 把 IR 中 的 转 
移 偏 移 量 加 到 PC 中 ， 从 而 得 到 用 于 取出 下 一 条 指令 的 地 址 。 转 移 指令 的 执行 在 第 3 步 完 成 。 
第 4 步 和 第 5 步 则 没有 执行 任何 动作 。 

我 们 在 2.13 节 中 解释 过 ， 转 移 偏 移 量 是 转移 目标 与 转移 指令 之 后 的 存储 单元 之 间 的 距离 。 
其 原因 在 图 5-15 中 是 显而易见 的 。 在 第 1 步 中 ，PC 递增 4， 此 时 取出 了 转移 指令 。 然 后 ， 在 
第 3 步 中 ， 通 过 将 转移 偏 移 量 与 PC 中 更 新 后 的 内 容 相 加 来 计算 转移 目标 地 址 。 
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存储 器 地 址 二 [PC]， 读 取 存 储 器 ，IR 二 存储 器 数据 ，PC 二 [PC] + 4 
对 指令 进行 译 码 


PC < [PC] + 转移 偏 移 量 
空 操作 
空 操作 





图 5-15 ” 读 取 并 执行 无 条 件 转移 指令 所 需 的 动作 序列 


我 们 可 以 很 容易 地 修改 图 5-15 所 示 的 序列 来 实现 条 件 转移 指令 。 在 那些 不 使 用 条 件 码 标 

志 的 处 理 器 中 ， 转 移 指令 会 指定 一 个 比较 - 测试 操作 来 确定 转移 条 件 。 例 如 ， 指 令 
Branch if [R5]=[R6] LOOP 

在 寄存 器 R5 和 R6 的 内 容 相 同时 ,会 引起 一 个 转移 。 在 执行 该 指令 时 ， 会 比较 这 两 个 寄存 器 

中 的 内 容 ， 如 果 相 等 ， 则 会 转移 到 位 置 LOOP 处 。 

图 5-16 显示 了 该 指令 是 如 何 执行 的 。 和 之 前 一 样 . 在 第 2 步 中 读 取 寄 存 器 R5 和 R6 的 内 
容 ， 并 在 第 3 步 中 进行 比较 。 其 中 ， 比 较 操 作 可 以 通过 在 ALU 中 进行 减法 运算 [R5] - [R6] 来 
完成 。ALU 会 生成 相应 的 信号 来 指示 减法 运算 的 结果 是 正 的 、 负 的 还 是 0。ALU 还 会 生成 信 
号 来 表示 是 否 发 生 了 算术 溢出 以 及 是 否 产生 了 进位 。 控 制 电路 会 检查 这 些 信 号 以 测试 转移 指令 
中 给 出 的 条 件 。 在 上 面 的 例子 中 ， 它 将 检测 减法 运算 的 结果 是 否 为 零 。 如 果 等 于 零 ， 就 将 转移 
目标 地 址 装 入 PC， 用 于 读 取 下 一 条 指令 。 否 则 ，PC 的 内 容 保持 在 第 1 步 中 递增 后 的 值 不 变 ， 
并 继续 以 线性 方式 执行 。 


存储 器 地 址 二 [PC], 读 取 存 储 器 ，IR ”< 存储 器 数据 ，PC < [PC]+4 
对 指令 进行 译 码 ，RA < [R5]，RB < [R6] 


比较 [RA] 和 [RB]， 如 果 [RA]= [RB]， 则 PC ~ [PC] + 转移 偏 移 量 
空 操作 
空 操作 





图 5-16 ” 读 取 并 执行 指令 Branch if [R5]=[R6] LOOP 所 需 的 动作 序列 


根据 图 5-16 所 示 的 步骤 序列 ， 比 较 寄存 髓 的 内 容 和 对 结果 进行 测试 这 两 个 动作 都 在 第 3 
步 中 完成 。 因 此 ， 时 钟 周期 必须 足够 长 ， 以 保证 这 两 个 动作 能 依次 完成 。 由 于 这 个 原因 ， 比 较 
操作 理应 尽快 完成 。ALU 中 的 减法 运算 很 耗 时 ， 不 过 在 这 里 我 们 也 不 需要 进行 减法 运算 。 用 
一 个 简单 而 快速 的 比较 器 电路 就 可 以 比较 寄存 器 RA 和 RB 的 内 容 并 产生 指示 大 于 、 等 于 或 是 
小 于 等 条 件 的 条 件 信号 。 图 5-8 中 并 没有 单独 画 出 比较 器 ， 因 为 它 可 以 是 ALU 模块 的 一 部 分 。 
例 5.3 展示 了 如 何 设 计 一 个 比较 器 电路 。 

2. 子 程序 调用 指令 

子 程序 调用 和 返回 的 实现 方式 与 转移 指令 相似 。 子 程序 的 地 址 可 能 会 使 用 指令 中 给 出 的 
立即 值 计 算得 到 ， 也 可 能 会 由 一 个 通用 寄存 器 完全 给 出 。 图 5-17 给 出 了 下 面 指令 的 动作 序列 : 

Call Register R9 

该 指令 调用 一 个 子 程序 ， 其 地 址 在 寄存 器 R9 中 。 在 第 2 步 中 ， 读 取 该 寄存 器 的 内 容 并 将 其 装 
和 人 RA 中 。 在 第 3 步 中 ， 多 路 复 用 器 MuxPC 选择 其 输入 端 9， 从 而 将 寄存 器 RA 中 的 数据 装 
人 PC 中 。 
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存储 器 地 址 二 [PC], 读 取 存储 器 、IR 二 存储 器 数据 ，PC < [PC] +4 
对 指令 进行 诺 码 ，RA < [R9] 


PC-Temp <— [PC], PC «~ [RA] 
RY 一 [PC-Temp] 
寄存 器 LINK < [RY] 





图 5-17 读 取 并 执行 指令 Call_Register R9 所 需 的 动作 序列 


假设 子 程序 的 返回 地 址 ， 即 之 前 PC 中 的 内 容 ， 被 保存 在 寄存 器 文件 的 一 个 通用 寄存 器 
LINK 中 。 在 第 5 步 中 ， 数 据 被 写 人 寄存 器 文件 中 。 因 此 ， 不 可 能 在 第 3 步 直 接 将 返回 地 址 发 
送 给 寄存 器 文件 。 为 了 在 这 个 五 阶段 结构 中 保持 数据 流 的 正确 性 ， 处 理 器 将 返回 地 址 保存 在 一 
个 临时 寄存 器 PC-Temp 中 。 在 第 4 步 中 ,返回 地 址 从 PC-Temp 传送 到 寄存 器 RY 中 ， 然 后 在 
第 $ 步 中 再 传送 到 寄存 器 LINK 中 。 地 址 LINK 被 内 置 于 控制 电路 中 。 

子 程序 返回 指令 将 寄存 器 LINK 中 保存 的 值 再 传 回 到 PC 中 。Return-from-subroutine 指令 
的 编码 使 得 寄存 器 LINK 的 地 址 出 现在 位 IRa-> 中 。 该 字段 与 寄存 器 文件 的 地 址 A 相连 。 因 
此 , 一 旦 指令 被 取出 ， 就 会 去 读 取 寄存 器 LINK 并 将 其 内 容 放 到 RA 中 ， 然 后 通过 图 5-10 中 
的 MuxPC 将 它们 再 从 RA 传送 到 PC 中 。Return-from-interrupt 指令 以 类 似 的 方式 进行 处 理 ， 
除了 它 是 使 用 一 个 不 同 的 寄存 器 来 保存 返回 地 址 。 


5.4.2 等待 存储 器 


处 理 器 -存储 器 接口 电路 的 作用 是 控制 处 理 器 和 存储 器 之 间 的 数据 传输 。 前 面 我 们 曾 指 
出 ， 现 代 处 理 器 使 用 快速 的 片上 高 速 缓存 。 大 多 数 时 候 ， 存 储 器 的 读 写 操作 所 引用 的 指令 或 数 
据 都 可 以 在 高 速 缓存 中 找到 ， 此 时 ， 读 写 操作 可 以 在 一 个 时 钟 周 期 内 完成 。 当 所 请 求 的 信息 不 
在 高 速 缓存 中 并 且 不 得 不 从 主 存储 器 中 读 取 时 ， 则 需要 花费 几 个 时 钟 周期 。 此 时 ， 接 口 电路 必 
须 将 这 种 情况 通知 给 处 理 器 的 控制 电路 ， 以 便 将 后 续 的 执行 步骤 延迟 直到 存储 器 操作 完成 。 

假设 处 理 器 -存储 器 接口 电路 产生 一 个 叫做 存储 器 功能 完成 (Memory Function 
Completed，MEFC ) 的 信号 ， 它 会 在 所 请 求 的 存储 器 读 写 操作 完成 时 发 出 该 信号 。 当 处 理 器 发 
出 一 个 存储 器 读 写 请 求 时 ， 处 理 器 的 控制 电路 会 检测 该 信号 ， 以 确定 它 何 时 可 以 进入 下 一 步 。 
当 所 请 求 的 数据 在 高 速 缓存 中 时 ， 接 口 电 路 就 会 在 发 出 存储 器 请 求 的 时 钟 周 期 结束 之 前 发 出 
一 个 MFC 人 信号。 因此， 指令 继续 执行 而 不 会 中 断 。 如 果 需 要 访问 主 存储 器 ， 接 口 电 路 就 延迟 
发 送 MFC 信号 直到 该 操作 完成 。 在 这 种 情况 下 ， 处 理 器 的 控制 电路 必须 把 执行 步骤 的 持续 时 
间 延 长 为 所 需要 的 多 个 时 钟 周期 ， 直 到 MFC 信号 发 出 。 我 们 使 用 命令 Wait for MFC 来 表示 必 
须 延 长 一 个 给 定 的 执行 步 又 ， 如 果 有 必要 ， 一 直 延 长 到 存储 器 操作 完成 。 当 接收 到 MFC 信号 
时 ， 表 明 该 步骤 所 指定 的 动作 已 经 完成 ， 处 理 器 继续 执行 序列 中 的 下 一 步 。 

任何 指令 ， 在 其 执行 序列 的 第 1 步 都 需要 从 存储 器 中 读 取 指令 。 因 此 ， 必 定 会 包含 一 条 
Wait for MFC 指令 ， 如 下 所 示 : 

存储 器 地 址 二 [PC]， 读 取 存 储 器 ，Wait for MFC， 
IR 二 存储 器 数据 ，PC 二 [PC] + 4 

5-13 以 及 图 5-14 中 Load 和 Store 指令 的 第 4 步 也 需要 Wait for MFC 指令 。 大 多 数 时 候 ， 所 
请 求 的 信息 会 在 高 速 缓冲 中 找到 ， 因 此 会 很 快 产生 MFC 信和 号， 这 样 该 步骤 可 以 在 一 个 时 钟 
周期 内 完成 。 当 需要 访问 主 存 储 器 时 ，MFC 响应 会 被 延迟 ， 从 而 该 步骤 会 被 延长 至 多 个 时 
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5.5 控制 信号 

处 理 器 硬件 组 件 的 操作 是 由 控制 信号 控制 的 。 这 些 信号 决定 多 路 复 用 器 要 选择 哪 一 个 输 
入 端 ，ALU 要 执行 什么 样 的 操作 ， 等 等 。 在 这 一 节 中 ， 我 们 将 讨论 控制 图 5-8 至 图 5-10 中 所 
示 组 件 的 操作 所 需要 的 信和 号。 

为 了 便于 理解 ， 我们 先 回顾 一 下 数据 是 如 何 流 经 数据 通路 的 四 个 阶段 的 ， 如 5.3.3 节 所 
述 。 在 每 个 时 钟 周期 中 ， 发 生 在 某 个 阶段 的 动作 所 得 到 的 结果 被 存储 在 段 间 寄存 器 中 ， 以 便于 
在 下 一 个 时 钟 周期 中 被 下 一 个 阶段 使 用 。 由 于 数据 在 每 个 时 钟 周 期 都 要 从 一 个 阶段 传送 到 下 一 
个 阶段 ， 所 以 段 间 寄 存 器 总 是 处 于 启用 状态 。 寄 存 器 RA、RB、RZ、RY、RM 以 及 PC-Temp 
都 是 这 种 情况 。 其 他 寄存 器 中 的 内 容 ， 即 PC、IR 和 寄存 器 文件 ， 在 每 个 时 钟 周 期 内 都 必须 保 
持 不 变 。 只 有 在 一 个 特定 的 处 理 步骤 中 调用 新 数据 时 ， 新 数据 才 会 被 装 人 这 些 寄 存 器 中 ， 这 些 
寄存 器 也 只 有 在 那 种 情况 下 才 处 于 启用 状态 。 

多 路 复 用 器 的 作用 是 可 以 在 任何 给 定 的 阶段 选择 将 要 操作 的 数据 。 例 如 图 5-8 中 第 3 阶段 
的 MuxB， 当 指令 中 使 用 了 一 个 立即 源 操作 数 时 ， 它 会 选择 IR 中 的 立即 数字 段 ; 当 指 令 使 用 
立即 数 作为 偏 移 量 计算 存储 器 操作 数 的 有 效 地 址 时 ， 它 也 会 选择 IR 中 的 立即 数字 段 ; 否则 ， 
它 会 选择 寄存 器 RB。MuxB 选择 的 数据 供 ALU 使 用 。 仔 细 观 察 图 5-11 、 图 5-13 和 图 5-14， 
我 们 发 现 ALU 只 在 第 3 步 中 用 到 ， 因 此 MuxB 的 选择 也 只 在 这 一 步 中 才 起 作用 。 为 了 简化 所 
需 的 控制 电路 ，MuxB 可 以 在 所 有 的 执行 步骤 中 保持 相同 的 选择 。 对 于 MuxY 也 可 以 做 同样 的 
处 理 。 然 而 ， 图 5-9 中 的 MuxMA 在 不 同 的 执行 步骤 中 必须 改变 其 选择 。 在 第 1 步 中 取出 新 的 
指令 时 ， 它 选择 PC 作为 存储 器 地 址 。 而 在 Load 和 Store 指令 的 第 4 步 中 ， 它 选择 寄存 器 RZ， 
该 寄存 器 中 包含 存储 器 操作 数 的 有 效 地 址 。 

所 需 的 控制 信号 如 图 5-18 一 图 5-20 所 示 。 寄 存 器 文件 有 三 个 5$ 位 的 地 址 输入 端 ， 可 以 访 
问 32 个 通用 寄存 器 。 其 中 两 个 输入 端 ， 地 址 A 和 地 址 B， 确 定 了 将 要 读 取 的 寄存 器 。 它 们 与 
指令 寄存 器 中 的 字段 民 3127 和 IRz6_-wz 相连 。 第 三 个 地 址 输入 端 ， 地 址 C， 用 于 选择 目的 寄存 
器 ， 端 口 C 上 的 输入 数据 会 被 写 人 到 该 寄存 器 中 。 多 路 复 用 器 MuxC 用 于 选择 地 址 C 的 来 源 。 
如 图 5-12 所 示 ， 我 们 已 经 作出 假设 : 三 寄存 器 指令 使 用 IR2 -7 而 其 他 指令 使 用 IR26-z 来 指定 
目的 寄存 器 。 多 路 复 用 器 MuxC 的 第 三 个 输入 端 是 子 程序 链接 指令 中 使 用 的 链接 寄存 器 的 地 
址 。 只 有 当 控制 信号 RF_write 发 出 后 ， 新 数据 才 会 被 装 人 所 选择 的 寄存 器 中 。 

多 路 复 用 器 受信 号 的 控制 选择 让 哪个 输入 数据 出 现在 多 路 复 用 器 输出 端 。 例 如 ， 当 B_ 
select 等 于 0 时 ，MuxB 选择 将 寄存 器 RB 的 内 容 传 送 到 ALU 的 输入 端 ImB。 需 要 注意 的 是 ， 
控制 MuxC 和 MuxY 的 信号 需要 两 个 位 ， 因 为 这 两 个 多 路 复 用 器 都 需要 从 三 个 输入 端 中 选择 
一 和 i 

一 个 大 位 的 控制 码 ALU_op 确定 了 ALU 要 执行 的 运算 ， 该 控制 码 可 以 表示 2* 个 不 同 的 运 
算 ， 如 Add，Subtract，AND，OR 以 及 XOR。 当 一 条 指令 要 求 比较 两 个 值 的 大 小 时 ， 一 个 比 
较 器 会 执行 指定 的 比较 运算 ， 正 如 我 们 之 前 提 到 的 那样 。 比 较 器 将 产生 指示 比较 结果 的 条 件 信 
号 。 在 执行 条 件 转移 指令 时 ， 控 制 电路 会 检查 这 些 信 号 以 确定 转移 条 件 是 否 成 立 。 

处 理 器 和 存储 器 之 间 的 接口 以 及 与 指令 寄存 器 相关 的 控制 信号 如 图 5-19 所 示 。MEM _read 
和 MEM_write 这 两 个 信号 用 于 初始 化 存储 器 读 或 写 操作 。 当 请 求 的 操作 完成 时 ， 该 接口 发 出 
MFC 信号。 指令 寄存 器 通过 控制 信和 号 IR_enable 将 一 条 新 的 指令 装 人 寄存 器 。 在 取 指 令 阶 段 ， 
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该 信号 必须 在 MFC 信号 发 出 后 才能 被 激活 。 


RF_write IR21-17 
IR 26.22 LINK 
2 
IR 726 22 地 址 C 
河 C_select 






B_select 


。 言 号 
下 NA 四 | 
大 







返回 地 址 


InA InB 
ALU 
Out 
和 \V mar 
2 


图 5-18 数据 通路 的 控制 信号 


115 


我 们 已 经 假设 立即 数 模块 可 以 处 理 三 种 可 能 的 立即 值 形式 : 16 位 符号 扩展 值 ，16 位 无 
符号 扩展 值 和 26 位 以 特殊 方式 处 理 的 值 ( 参见 习题 5.14 )。 因 此 ， 其 控制 信号 Extend 包含 


了 两 位 。 


控制 指令 地 址 发 生 器 操作 的 信和 号 如 图 5-20 所 示 。 其 中 INC _select 信号 用 来 选择 加 到 PC 
中 的 值 是 常数 4 还 是 指令 中 指定 的 转移 偏 移 量 。 当 控制 信号 PC_enable 被 激活 时 ，PC_select 信 


号 会 选择 已 更 新 的 地 址 或 者 寄存 器 RA 的 内 容 并 将 其 装 入 PC 中 。 
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IR_enable 





MA select 







MEM _read 








连接 高 速 缓存 和 主 存储 器 
图 5-19 ”处 理 器 -存储 器 接口 和 IR 控制 信号 





立即 值 
(转移 偏 移 量 ) 







INC_select 






MuxY 
(返回 地 址 ) 


图 5-20 ”指令 地 址 发 生 器 的 控制 信号 


5.6 ”硬件 控制 


前 几 节 讨论 了 取 指 令 和 执行 指令 所 需 的 动作 。 现 在 我 们 来 研究 处 理 器 是 如 何 产生 所 需 的 
控制 信号 以 使 得 这 些 动作 能 够 在 合适 的 时 间 以 正确 的 顺序 发 生 。 有 两 种 基本 的 方法 : 硬件 控制 
和 微 程序 控制 。 本 节 讨 论 硬件 控制 方法 。 

指令 按 一 定 的 步骤 序列 执行 ， 该 序列 中 的 每 一 步 都 需要 在 一 个 时 钟 周期 内 完成 。 因 而 可 
以 使 用 一 个 步 计 数 器 来 跟踪 执行 的 进度 。 在 每 一 步 内 可 以 执行 多 个 动作 ， 这 具体 取决 于 正在 执 
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行 的 指令 。 在 某 些 情况 下 ， 比 如 转移 指令 ， 要 执行 的 动作 取决 于 计算 结果 或 者 比较 操作 的 结 
果 。 而 外 部 信号 ( 如 中 断 请 求 ) 也 有 可 能 会 影响 到 将 要 执行 的 动作 。 因 此 ， 控 制 信号 的 设置 取 
决 于 : 

e 步 计 数 器 的 内 容 。 

。 指令 寄存 器 的 内 容 。 

。 计算 结果 或 比较 操作 的 结果 。 

e。 外 部 输入 信号 ， 比 如 中 断 请 求 。 

生 成 控 制 入 号 的 电 路 可 以 按 图 S-21 Counter_enable 
所 示 的 方式 组 织 。 其 中 指令 译 码 器 负责 解 
释 操作 码 以 及 IR 中 的 寻 址 方式 信息 ， 并 
将 相应 的 INS 输出 置 为 1。 在 每 个 时 钟 
周期 中 ， 步 计数 器 输出 端 T1 到 Ts5 中 的 
一 个 被 置 为 1， 以 表明 当前 正在 执行 指令 
的 哪 一 步 。 由 于 所 有 的 指令 都 在 五 个 步骤 
内 完成 ， 所 以 我 们 可 以 使 用 一 个 模 5 计数 
器 。 控 制 信号 发 生 器 实际 上 是 一 个 组 合 电 
路 ， 它 根据 所 有 的 输入 来 产生 所 需 的 控制 
信和 号。 控制 信号 所 需 的 设置 信息 由 实现 每 
条 指令 (由 信和 号 INS1 到 INSm 表示 ) 的 
动作 序列 确定 。 


作为 一 个 例子 ， 考 虑 指令 执行 过 程 控制 信号 
的 第 1 步 ， 在 该 步 中 ， 一 条 新 指令 从 存储 图 5.21 控制 信和 号 的 生成 


器 中 取出 。 我 们 通过 发 出 信号 Tl 来 识别 

这 一 步 。 在 该 时 钟 周 期 内 ， 图 5-19 中 的 MA_select 信和 号 被 置 为 1 以 选择 PC 作为 存储 器 地 址 ， 
MEM read 信和 号 被 激活 以 初始 化 存储 器 读 操 作 。 当 存储 器 发 出 响应 信号 MFC 时 ,IR_enable 
信和 号 被 激活 以 将 从 存储 器 中 取出 的 数据 装 入 及 中 。 同 时， 图 5-20 中 的 INC_select 被 置 为 0、 
PC _select 被 置 为 1， 以 使 PC 的 值 增 加 4。 最 后 ， 激 活 PC_enable 信号 ， 以 将 新 的 PC 值 在 标志 
Tl 步 结 束 的 时 钟 上 升 沿 装 和 人 PC 中 。 


5.6.1 数据 通路 控制 信号 


处 理 数据 的 指令 包括 Load 、Store 以 及 所 有 计算 型 的 指令 ， 它 们 通过 处 理 器 的 数据 通路 进 
行 各 种 数据 传输 和 操纵 操作 ， 该 数据 通路 的 控制 信号 如 图 5-18 和 图 5-19 所 示 。 一 旦 有 指令 装 
入 IR 中 ， 指 令 译 码 器 便 解 释 其 内 容 并 确定 所 需 的 动作 。 同 时 ， 读 取 源 寄存 器 ， 并 将 它们 的 内 
容 放 到 寄存 器 文件 的 两 个 输出 端 A 和 B 上 。 前 面 我 们 提 到 ， 段 间 寄 存 器 RA、RB、RZ、RM 
和 RY 一 直 都 处 于 启用 状态 。 这 就 意味 着 在 每 个 时 钟 信号 的 工作 沿 ， 数 据 会 自动 从 数据 通路 的 
一 个 阶段 流向 下 一 个 阶段 。 

我 们 通过 检查 每 条 指令 的 每 一 个 执行 步 中 所 发 生 的 动作 ,来 决定 各 种 控制 信号 所 需 的 设 
置 。 例 如 ， 在 执行 一 条 将 数据 写 人 寄存 器 文件 的 指令 时 ， 会 在 T5 步 中 把 RF_write 信和 号 置 为 
1。 该 信号 可 以 通过 下 列 逻 辑 表 达 式 产生 : 

REF write=I5。(ALU + Load + Call) 
其 中 ALU 表示 所 有 执行 算术 或 逻辑 运算 的 指令 ，Load 表示 所 有 的 Load 指令 ，Call 表示 所 有 
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的 子 程序 调用 以 及 软件 中 断 指令 。RF_write 信号 是 指令 和 时 序 信号 的 函数 。 但 是 ， 正 如 我 们 前 
面 提 到 的 ， 一 些 多 路 复 用 器 的 设置 并 不 需要 在 各 个 时 序 步 中 做 任何 改变 。 这 种 情况 下 ， 多 路 复 
用 器 的 选择 信号 就 可 以 只 用 指令 的 函数 来 实现 ， 例 如 : 

B _ select = Inmediate 
其 中 ，Immediate 表示 所 有 在 IR 中 使 用 立即 值 的 指令 。 我 们 鼓励 读者 研究 其 他 控制 信号 ， 并 根 
据 各 种 指令 的 执行 步骤 得 出 恰当 的 逻辑 表达 式 。 


5.6.2 ”存储 器 延迟 的 处 理 
随 着 步 计数 器 的 递增 ， 时序 信号 T1 到 T5 会 按 顺序 发 出 。 大 多 数 时 候 ， 步 计数 器 在 每 个 
时 钟 周期 结束 时 递增 ,。 然而， 如果 在 某 一 步 中 发 出 了 MEM_read 和 MEM_write 命令 ， 则 直到 
发 出 MFC 信号 表明 请 求 的 存储 器 操作 已 经 完成 之 后 ， 该 步 才 会 结束 。 
为 了 将 一 个 执行 步骤 的 持续 时 间 延 长 到 一 个 时 钟 周 期 以 上 ， 我 们 需要 禁用 步 计 数 器 。 假 
设 只 有 当 Counter enable 控制 信号 启用 步 计 数 器 时 ， 它 才 会 递增 。 我 们 用 控制 信号 WMFC 来 
表示 正在 等 待 存储 器 操作 完成 。 在 任何 执行 步 中 ， 只 要 发 出 Wait for MFC 命令 ，WMFC 就 会 
被 激活 。 未 发 出 WMFC 信号 时 ， 应 该 将 Counter_ enable 信和 号 置 为 1。 另外， 在 发 出 MFC 信和 号 
时 ， 应 将 它 置 为 1。 这 就 是 说 : 
Counter enable = WMEFC + MFC 
在 图 5-20 中 的 PC_enable 信号 被 激活 的 情况 下 ， 在 每 个 时 钟 周期 结束 时 ， 一 个 新 值 会 被 
装 入 PC 中 。 当 把 执行 步 延长 为 多 个 时 钟 周期 时 ， 我 们 必须 确保 PC 的 值 只 被 递增 一 次 。 因 此 ， 
在 取 指 令 时 ， 只 有 在 收 到 MFC 信号 后 PC 才 会 被 启用 。 在 引发 转移 的 指令 的 第 3 步 中 ，PC 也 
会 被 启用 。 我 们 用 BR 表示 所 有 引发 转移 的 指令 。 那 么 ，PC_enable 可 以 用 如 下 方式 实现 : 
PC enable =T1。MFC + TI3。 了 BR 


5.7 CICS 风格 的 处 理 器 


在 前 面 的 章节 中 ， 我 们 知道 RISC 风格 的 指令 集 有 助 于 实现 多 阶段 结构 的 处 理 器 。 所 有 的 
指令 都 可 以 使 用 相同 的 五 阶段 硬件 来 按 统一 的 方式 执行 。 因 此 ， 其 硬件 结构 简单 而 且 适 于 流水 
线 操作 。 同 时 ， 控 制 信和 号 也 比较 容易 生成 。 

CISC 风格 的 指令 集 则 更 为 复杂 ， 因 为 它们 使 指令 操作 数 的 访问 具有 更 大 的 灵活 性 。 与 只 
有 Load 和 Store 指令 能 够 访问 存储 器 数据 的 RISC 风格 指令 集 不 同 ，CISC 指令 可 以 直接 对 存 
储 器 操作 数 进行 操作 。 此 外 ， 它 们 也 不 受 一 个 字 长 的 限制 。 正 如 我 们 在 2.10 节 所 描述 的 ， 一 
条 指令 可 以 用 几 个 字 来 指定 操作 数 地 址 和 所 要 执行 的 动作 。 因 此 ，CISC 风格 的 指令 需要 不 同 
的 处 理 器 硬件 结构 。 

图 5-22 给 出 了 一 个 可 能 的 处 理 器 结构 。 这 个 结构 与 之 前 讨论 的 五 阶段 结构 之 间 的 主要 区 
别 在 于 互 连 模块 ， 该 模块 将 其 他 各 个 模块 相互 连接 ， 其 本 身 并 不 规定 数据 流 的 特定 结构 或 模 
式 。 它 提供 路 径 ， 使 得 在 完成 指令 所 需 的 任意 两 个 组 件 之 间 可 以 进行 数据 传输 。 图 5-8 的 多 阶 
段 结构 使 用 了 段 间 寄存 器 ， 如 RZ 和 RY。 图 5-22 的 结构 中 不 需要 这 些 寄存 器 。 然 而 ， 为 了 保 
存 指令 执行 过 程 中 的 中 间 结 果 ， 也 需要 一 些 寄存 器 。 图 中 所 示 的 临时 寄存 器 模块 就 是 为 了 这 个 
目的 而 设计 的 。 它 包含 了 两 个 临时 寄存 器 ，Templ 和 Temp2。 通 过 后 面 的 例子 ， 我 们 可 以 清晰 
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地 了 解 这 两 个 寄存 器 的 必要 性 。 
实现 互 连 的 一 种 传统 方法 是 使 用 总 线 。 总 线 (bus ) 是 由 连接 多 个 设备 的 一 组 线路 组 成 的 ， 
使 得 数据 可 以 在 任意 两 个 设备 之 间 传输 。 我 们 把 在 总 线 线 路 上 发 送信 号 的 逻辑 门 称 为 总 线 驱 动 
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器 (bus driver )。 由 于 每 一 个 与 总 线 相连 的 设备 都 可 以 发 送 数据 ， 我 们 必须 确保 在 任何 时 刻 只 
有 一 个 设备 在 驱动 总 线 。 为 此 ， 总 线 驱动 器 被 设计 为 一 个 特殊 类 型 的 逻辑 门 ， 称 为 三 态 门 〈tri- 
state )。 它 包括 一 个 可 以 将 其 打开 或 关闭 的 控制 输入 端 。 当 打开 三 态 门 时 ， 三 态 门 根据 其 输入 的 
值 将 逻辑 信号 0 或 1 放置 到 总 线 上 。 当 关闭 时 ， 三 态 门 在 电路 上 与 总 线 断 开 连 接 ， 如 附录 A 
所 述 。 





图 5-22 CICS 风格 处 理 器 的 结构 


图 5-23 显示 了 形成 数据 寄存 器 中 一 总 线 
个 位 的 触发 器 是 如 何 连接 到 总 线 上 的 。 
有 两 个 控制 信号 Ra 和 Ru， 当 Ri 等 于 
1 时 ， 多 路 复 用 器 将 总 线 线路 上 的 数据 
装 和 触发 器 中 。 将 Ri 置 0 会 使 得 触发 
器 保持 其 当前 值 。 触 发 器 的 输出 端 通过 
一 个 三 态 门 连 到 总 线 线路 上 ， 当 发 出 信 
号 Ro 时， 三 态 门 就 被 打开 。 在 其 他 时 





间 ， 三 态 门 是 关闭 的 ， 从 而 可 以 允许 其 Ww 时钟 
他 的 组 件 驱 动 总 线 线路 。 图 5-23 ”一 个 寄存 器 位 的 输入 /输出 门 


5.7.1 使 用 总 线 实现 互 连 

图 5-22 中 的 互 连 模块 可 以 使 用 一 个 或 多 个 总 线 实 现 。 图 5-24 给 出 了 一 种 三 总 线 的 实现 方 
案 。 假 定 所 有 的 寄存 器 都 是 边沿 触发 的 ， 也 就 是 说 ， 当 寄存 器 处 于 启用 状态 时 ， 在 时 钟 周期 结 
束 时 的 时 钟 工作 沿 将 数据 装 和 其中。 控制 模块 为 寄存 器 文件 的 三 个 端口 提供 地 址 。 为 了 简洁 
见 ， 我们 没有 在 图 中 画 出 这 些 连 接 。 同 样 也 没有 画 出 将 IR 连 到 总 线 B 上 的 立即 数 模块 ， 该 模 
块 的 电路 将 IR 中 的 立即 操作 数 扩展 为 32 位 。 

考虑 双 操作 数 指令 
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该 指令 执行 的 操作 为 


Add RS, R6 


R5 + [R5] + [R6] 


用 图 5-24 中 的 硬件 取出 并 执行 该 指令 的 
操作 可 以 在 三 步 内 完成 ， 如 图 5-25 所 
示 。 每 一 步 ， 只 要 不 涉及 存储 器 访问 ， 
都 可 以 在 一 个 时 钟 周 期 内 完成 。 在 第 1 
步 中 ,我 们 使 用 总 线 B 将 PC 的 内 容 发 
送 至 处 理 器 -存储 器 接口 ， 该 接口 再 将 
PC 的 内 容 发 送 到 存储 器 地 址 线 上 并 初始 
化 存储 器 读 操作 。 从 存储 器 中 获得 的 数 
据 ， 即 要 执行 的 指令 ， 通 过 总 线 C 发 送 
到 IR 中 。5.4.2 节 已 经 解释 过 存储 器 访问 
时 间 可 能 会 超过 一 个 时 钟 周期 ， 所 以 在 
这 里 我 们 插入 一 个 Wait for MFC 命令 来 
进行 调整 。 在 第 2 步 中 ， 对 指令 进行 译 
码 ， 同 时 控制 电路 开始 读 取 源 寄 存 器 R5 
和 R6。 然 而 ， 直 到 第 3 步 ， 寄 存 器 的 内 
容 才 被 放 到 寄存 器 文件 的 A、B 输出 端 
上 。 随 即 通过 总 线 A 和 B 将 它们 发 送 至 
ALU。 由 ALU 执行 加 法 运算 ， 其 结果 通 
过 总 线 C 送 回 至 ALU， 并 在 该 时 钟 周期 
结束 时 将 其 写 和 人 寄存 器 R5。 

我 们 注意 到 ， 在 图 5-11 中 ， 读 取 源 
寄存 器 的 操作 是 在 第 2 步 完成 的 。 那 时 ， 
读 取 寄存 器 的 操作 与 指令 译 码 操作 并 行 
进行 ， 因 为 RISC 风格 的 指令 中 包含 寄 
存 器 地 址 的 位 字段 位 置 是 已 知 的 。 由 于 
CISC 风格 的 指令 并 不 总 是 使 用 同一 个 指 
令 字段 来 指定 寄存 器 地 址 ， 因 此 在 指令 
至 少 被 部 分 译 码 之 前 ， 读 取 源 寄存 器 的 
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总 线 B 总 线 C 
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寄存 器 文件 C 
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处 理 器 -存储 器 接口 


|- 


连接 高 速 缓存 和 主 存 
图 5-24 三 总 线 的 CISC 风格 的 处 理 器 结构 


操作 是 不 会 开始 的 。 因 此 ， 读 取 源 寄存 器 的 操作 就 可 能 无 法 在 第 2 步 内 完成 。 


存储 器 地 址 <- [PC], 读 取 存 储 器 ，Wait for MFC，IR < 存储 器 数据 


PC < [PC]+4 
对 指令 进行 译 码 
R5 < [R5] + [R6] 





图 5-25 ” 读 取 并 执行 指令 Add R5, R6 所 需 的 动作 序列 


接 下 来 ， 考 虑 指令 


And X(R7),R9 
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指令 对 寄存 器 R9 和 存储 单元 X + [R7] 的 内 容 进行 逻辑 AND 运算 ， 并 把 结果 存 回 到 X +[R7] 
假设 变 址 偏 移 量 XX 是 32 位 的 值 ， 由 指令 中 的 第 二 个 字 给 出 。 为 了 执行 该 指令 ， 需 要 对 存 
储 器 进行 四 次 访问 。 首 先 ， 取 出 操作 码 。 然 后 ， 当 指令 译 码 电路 识别 出 变 址 方式 时 ， 取 出 变 址 
偏 移 量 X。 接 着 ， 读 取 存 储 器 操作 数 并 进行 AND 运算 。 最 后 ， 再 将 结果 存 回 到 存储 器 中 。 


存储 器 地 址 < [PC], 读 取 存储 器 ，Wait for MFC，IR < 存储 器 数据 ， 
PC < [PC] +4 


对 指令 进行 译 码 
存储 器 地 址 < [PC], 读 取 存 储 器 ，Wait for MFC，Templ < 存储 器 数据 


PC < [PC] +4 
Temp2 < [Templ1] + [R7] 

存储 器 地 址 ”< [Temp2], 读 取 存储 器 ，Wait for MFC，Templ < 存储 器 数据 
Templ < [Templ1] AND [R9] 

存储 器 地 址 < [Temp2], 读 取 存储 器 <- [Temp1], 写 人 存储 器 ，Wait for MFC 





图 5-26 读 取 并 执行 指令 And X(R7), R9 所 需 的 动作 序列 


图 5-26 给 出 了 执行 该 指令 的 步骤 。 在 第 2 步 中 对 指令 进行 译 码 。 然 后 在 第 3 步 中 读 取 指 
令 的 第 二 个 字 。 所 得 到 的 数据 ( 即 偏 移 量 X ) 被 临时 存储 在 寄存 器 Templ 中 ， 以 便 在 下 一 步 
中 用 来 计算 存储 器 操作 数 的 有 效 地 址 。 在 第 4 步 中 ， 寄 存 器 Templ 和 R7 的 内 容 通过 总 线 A 
和 了 B 发 送 到 ALU 的 输入 端 ， 计 算得 到 有 效 地址 并 将 其 装 人 寄存 器 Temp2 中 。 在 第 5 步 中 使 用 
该 地 址 读 取 操 作 数 并 用 寄存 器 Templ 保存 这 个 从 存储 器 中 接收 到 的 数据 操作 数 。 在 第 6 步 中 
开始 进行 计算 ， 其 结果 会 被 放 回 到 寄存 器 Templ 中 。 在 最 后 一 步 中 ， 再 将 结果 发 送 至 地 址 仍 
存储 在 寄存 器 Temp2 中 的 操作 数 所 指向 的 存储 单元 中 存储 。 

图 5-25 和 图 5-26 中 的 两 个 例子 说 明了 CISC 风格 指令 的 执行 步 数 是 可 变 的 。 与 5.2 节 中 
所 述 的 RISC 风格 指令 不 同 ， 这 里 不 存在 一 个 适合 所 有 指令 的 统一 动作 序列 。- 


5.7.2 ” 微 程 序 控制 


控制 图 5-22 和 图 5-24 中 组 件 操 作 的 控制 信号 可 以 通过 使 用 5.6 节 中 的 硬件 方法 生成 。 但 
是 ， 在 过 去 还 流行 着 另外 一 种 有 趣 的 控制 方式 ， 下 面 我 们 将 会 介绍 。 

根据 IR 中 的 指令 ， 我 们 为 每 一 个 执行 步 生成 相应 的 控制 信号 。 在 硬件 控制 方式 中 ， 这 
些 信号 是 由 解释 IR 内 容 的 电路 以 及 步 计数 器 的 时 序 信和 号 产生 的 。 如 果 不 采 用 这 样 的 电路 ,我 
们 还 可 以 使 用 一 种 “软件 ”的 方法 ， 即 由 存储 在 特殊 存储 器 中 的 一 个 程序 来 决定 每 一 步 中 控 
制 信号 所 需 的 设置 。 为 了 将 其 与 处 理 器 执行 的 程序 区 别 开 来 ， 我 们 把 该 控制 程序 称 为 微 程序 
( microprogram )。 微 程序 存储 在 处 理 器 芯片 上 一 个 小 型 而 快速 的 存储 器 中 ， 该 存储 器 被 称 为 微 
程序 存储 器 ( microprogram memory ) 或 控制 存储 器 ( control store )。 

假设 我 们 需要 n 个 控制 信和 号。 每 一 个 控制 信号 可 以 用 nn 位 字 中 的 一 位 来 表示 ,该 n 位 字 
通常 被 称 为 控制 字 (control word ) 或 微 指令 ( microinstruction )， 其 中 的 每 一 位 都 指定 了 执行 
流 中 特定 步 的 相应 信和 号 的 设置 。 对 于 指令 执行 序列 中 的 每 一 步 ， 都 对 应 有 一 个 控制 字 存 储 在 微 
程序 存储 器 中 。 例 如 ， 从 存储 器 中 读 取 指 令 或 数据 操作 数 的 动作 分 别 需 要 使 用 5.5 和 5.6.2 节 
所 介绍 的 MEM _read 信号 和 WMFC 信号 。 在 图 5-26 的 第 1、3、5 步 中 ， 通 过 将 控制 字 的 相应 
位 置 为 1， 即 可 发 出 这 些 信号 。 当 从 控制 存储 器 中 读 取 一 条 微 指 令 时 ， 每 个 控制 信号 的 值 就 是 
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其 对 应 位 的 值 。 
与 给 定 的 机 器 指令 相对 应 的 微 指 令 序 列 构成 了 实现 该 指令 的 微 例 程 (microroutine )。 
图 5-25 和 图 5-26 的 前 两 步 指定 了 取 指 令 和 指令 译 码 的 操作 。 这 些 操作 适用 于 所 有 指令 。 而 从 
第 3 步 开 始 ， 微 例 程 才 与 给 定 的 机 器 指令 相对 应 。 
图 5-27 描述 了 微 程 序 控制 所 需 硬 件 的 典型 结构 。 其 中 
包括 一 个 微 指令 地 址 发 生 器 ， 它 可 生成 用 于 从 控制 存储 器 





中 读 取 微 指令 的 地 址 。 该 地 址 发 生 器 使 用 了 微 程序 计数 器 
(microprogram counter ) PC， 以 便于 在 从 连续 的 单元 中 读 取 
微 指 令 时 跟踪 控制 存储 器 的 地 址 。 在 图 5-25 和 图 5-26 的 第 2 
步 中 ， 微 指令 地 址 发 生 器 对 IR 中 的 指令 进行 译 码 ， 以 便 得 到 
相应 微 例 程 的 起 始 地 址 ， 并 将 该 地 址 装 入 hPC 中 。 该 地 址 将 
用 于 在 下 一 个 时 钟 周期 读 取 第 3 步 中 相应 的 控制 字 。 随 着 执 
行 的 推进 ， 微 指令 地 址 发 生 器 将 hPC 递增 以 便 从 控制 存储 器 a 
的 连续 存储 单元 中 读 取 微 指令 。 微 指令 中 有 一 个 称 为 End 的 控制 信号 
位 ， 用 来 标记 给 定 微 例 程 的 最 后 一 条 微 指令 。 当 End 等 于 1 图 5-27 微 程序 控制 部 件 的 结构 
时 (图 5-25 的 第 3 步 和 图 5-26 的 第 7 步 就 是 这 种 情况 )， 地 
址 发 生 器 会 返回 到 对 应 于 第 1 步 的 微 指令 ， 这 样 就 可 以 取出 一 条 新 的 机 器 指令 。 

我 们 可 以 把 微 程序 控制 看 成 是 在 主 处 理 器 中 还 有 一 个 控制 处 理 器 。 微 指令 的 取出 和 执行 
与 机 器 指令 非常 相似 。 它 们 的 作用 就 是 确定 在 每 个 执行 步 中 需要 激活 哪些 控制 信号 以 指引 主 处 
理 器 硬件 组 件 的 操作 。 

微 程 序 控 制 很 容易 实现 且 能 够 在 控制 机 器 指令 的 执行 方面 提供 相当 大 的 灵活 性 。 但 是 ， 
它 比 硬件 控制 要 慢 。 同 时 ， 它 所 提供 的 灵活 性 在 RISC 风格 的 处 理 器 中 是 不 需要 的 。 正 如 本 章 
所 讨论 的 ， 实 现 RISC 风格 指令 所 需 的 控制 信号 是 很 容易 生成 的 。 由 于 逻辑 电路 的 成 本 已 经 不 
再 是 一 个 重要 因素 ， 所 以 硬件 控制 已 经 成 为 最 佳 选 择 。 
5.8 结束语 

在 本 章 中 ， 我 们 介绍 了 处 理 器 的 基本 结构 及 其 执行 指令 的 方式 。 现 代 处 理 器 采用 多 阶段 
的 组 织 结构 ， 该 结构 非常 适合 于 流水 线 操 作 。 每 个 阶段 实现 指令 的 一 个 执行 步 所 需 的 动作 。 
我 们 给 出 了 一 个 五 步 序 列 ， 在 该 序列 中 ， 每 一 步 都 在 一 个 时 钟 周期 内 完成 。 这 种 方法 常用 于 
RISC 风格 的 指令 集 处 理 器 中 。 

在 本 章 的 讨论 中 ,我们 假设 在 取出 下 一 条 指令 前 ， 前 一 条 指令 已 经 执行 完毕 。 随 着 指令 
的 执行 在 每 个 时 钟 周期 中 从 一 个 阶段 移动 到 下 一 阶段 ， 在 任意 时 刻 ， 五 个 硬件 阶段 中 只 有 一 个 
在 使 用 。 在 下 一 章 中 我 们 将 会 说 明 ， 将 多 条 连续 指令 的 执行 步 重 倒 起 来 是 有 可 能 的 ， 从 而 可 以 
带 来 更 好 的 性 能 。 这 就 是 流水 线 结构 。 
5.9 ”问题 解析 

本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解 决 这 样 的 问题 。 


问题 : 图 5-11 给 出 了 执行 Add 指令 的 五 个 步 双 ,但 是 在 第 4 步 中 并 没有 发 生 任何 处 理 操作 。 如 果 
我 们 想 要 去 除 这 一 步 ， 应 该 怎样 修改 图 5-8 中 的 数据 通路 ? 
解答 : 将 图 5-8 中 ALU 的 输出 直接 发 送 至 寄存 器 RY， 可 以 跳 过 第 4 步 。 我 们 可 以 给 多 路 复 用 器 
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MuxY 增加 一 个 输入 端 ， 并 将 该 输入 端 连接 到 ALU 的 输出 端 来 实现 。 这样， 在 ALU 输出 端的 计算 结果 
就 会 在 第 3 步 结束 时 装 人 寄存 器 RZ 和 RY 中 。 对 于 Add 指令 , 或 者 任意 其 他 的 计算 型 指令 ， 我 们 可 以 
在 第 4 步 中 激活 寄存 器 文件 控制 信号 RF_write 来 将 RY 的 内 容 装 入 寄存 器 文件 中 。 

问题 : 假设 在 一 个 使 用 1GHz 时 钟 的 处 理 器 中 ， 所 有 的 存储 器 访问 操作 都 在 一 个 时 钟 周 期 内 完成 。 
如 果 在 一 个 程序 中 ，Load 和 Store 指令 占 动 态 指令 数 的 20%， 那 么 存储 器 访问 操作 的 频率 是 多 少 ? ( 动 
态 指令 数 是 指 实际 执行 的 指令 数量 ， 包 括 可 能 会 使 得 一 些 指 令 被 执行 多 次 的 程序 循环 。 ) 假定 所 有 的 指令 
都 在 5 个 时 钟 周 期 内 执行 完成 。 

解答 : 读 取 每 一 条 指令 时 都 会 涉及 一 次 存储 器 访问 。 还 有 20% 的 指令 需要 对 存储 器 进行 第 二 次 访问 
以 便 读 取 或 写 人 存储 器 操作 数 。 平 均 而 言 ， 在 5 个 时 钟 周期 里 ， 每 条 指令 会 进行 1.2 次 存储 器 访问 。 因 
此 ， 存 储 器 访问 的 频率 是 (1.2/5) x 10?， 即 每 秒 2.4 亿 次 。 

问题 : 请 推导 出 比较 两 个 无 符号 数 艺 = xzxixo 和 了 = yoo 的 电路 的 逻辑 表达 式 ， 并 生成 三 个 输出 
XGY,，XEY 和 XLY。 将 其 中 的 一 个 输出 置 为 1 来 分 别 表示 碟 大 于 ， 等 于 或 小 于 7。 

解答 : 为 了 比较 两 个 无 符号 数 ， 我 们 需要 从 最 高 有 效 位 开始 ， 依 次 比较 各 个 位 。 如 果 x,= 1 且 y= 
0， 那 么 对 大 于 Y。 如 果 x = y,， 那 么 我 们 就 需要 比较 下 一 位 ， 以 此 类 推 。 因 此 ， 三 个 输出 的 逻辑 表达 式 
可 以 表示 为 : 





XGY = wy + (KW By) (XV + (Xl By1) Xoyo) 





XEY = (x2 BY): (x1 By) (Xo By0) 
XLY = XGY + XEY 


问题 : 请 给 出 RISC 风格 处 理 器 中 从 子 程序 返回 ( Return-from-subroutine ) 指令 的 动作 序列 . 假 
设 存储 了 子 程序 返回 地 址 的 通用 寄存 器 的 地 址 LINK 在 与 寄存 器 文件 的 地 址 A 相连 的 指令 字段 中 给 出 
( IR31-27 )。 

解答 : 每 当 指 令 被 装 和 人 IR 中 时 ， 我 们 都 会 读 取 位 IRa_z 所 指定 的 通用 寄存 器 的 内 容 ， 并 将 其 装 人 
寄存 器 RA 中 ( 见 图 5-18 )。 因 此 ， 从 子 程序 返回 指令 会 使 得 寄存 器 LINK 的 内 容 被 读 取 ， 并 装 人 寄存 器 
RA 中 。 其 执行 过 程 如 下 : 

1 ) 存储 器 地 址 二 [PC]， 读 取 存 储 器 ，Wait for MFC，IR 二 存储 器 数据 ，PC 一 [PC] + 4 

2 ) 对 指令 进行 译 码 ，RA 一 [LINK] 

3 ) PC [RA] 

4 ) 空 操作 

5 ) 空 操作 

问题 : 某 处 理 器 的 中 断 结 构 如 下 : 当 收 到 一 个 中 断 时 ， 会 将 该 中 断 的 返回 地 址 保存 到 通用 寄存 器 
IRA 中 。 处 理 器 状态 寄存 器 PS 的 当前 内 容 ， 会 被 保存 在 一 个 特殊 的 寄存 器 IPS 中， 该 寄存 器 不 是 通用 寄 
存 器 。 中 断 服务 程序 从 地 址 ILOC 开始 。 

假设 处 理 器 在 每 条 指令 的 最 后 一 个 执行 步 中 进行 中 断 检 测 。 如 果 出 现 中 断 请 求 ， 并 且 处 理 器 允许 中 
断 ， 则 该 中 断 请 求 被 接受 。 处 理 器 会 保存 PC 和 PS 并 跳 转 至 ILOC， 而 不 是 去 读 取 下 一 条 指令 。 请 给 出 
执行 这 些 操作 的 相应 步骤 序列 。 为 了 支持 中 断 处 理 ， 还 需要 在 图 5-18 到 图 5-20 中 增加 哪些 硬件 ? 

解答 : 指令 执行 的 前 两 步 ， 取 指令 和 指令 译 码 ， 在 中 断 的 情况 下 是 不 需要 的 。 这 两 步 可 以 被 跳 过 ， 
或 者 为 空 操作 以 保持 5 步 序 列 。 我 们 可 以 用 与 子 程序 调用 指令 完全 相同 的 方式 来 保存 PC。 图 5-18 中 的 
多 路 复 用 器 MUXC 需要 增加 一 个 输入 端 ， 并 将 其 与 寄存 器 IRA 的 地 址 相连 。 为 了 将 中 断 服务 程序 的 起 
始 地 址 装 和 人 PC 中 ,我 们 需要 为 图 5-20 中 的 MuxPC 增加 一 个 输入 端 与 ILOC 值 相连 。 寄 存 器 PS 与 IPS 
应 该 直接 互 连 ， 这 样 可 以 使 数据 在 两 者 之 间 传 输 。 所 需 的 执行 步骤 如 下 : 
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3. PC-Temp 二 [PC]，PC 一 ILOC，IPS 和 二 [PS],， 禁止 中 断 
4. RY «~ [PC-Temp] 
5.IRA +— [RY] 
对 Return-from-interrupt 指令 而 言 ， 上 述 操作 是 逆向 进行 的 。 参 见习 题 5.8。 
问题 : 例 5.5 说 明了 当 接 收 到 中 断 请 求 时 PC 和 PS 的 内 容 是 如 何 保存 的 。 如 3.2 节 所 述 ， 为 了 支持 
中 断 嵌 套 ， 中 断 服务 程序 需要 将 这 些 寄存 器 保存 到 处 理 器 堆栈 中 。 要 做 到 这 一 点 ， 就 需要 在 接收 中 断 时 
将 保存 在 寄存 器 IPS 中 的 PS 的 内 容 移 到 一 个 通用 寄存 器 中 ， 然 后 再 从 那里 保存 到 堆栈 中 。 假 设 两 条 特殊 
的 指令 
MoveControl Ri, IPS 
和 
MoveControl IPS, Ri 
可 分 别 用 来 保存 和 恢复 IPS 的 内 容 。 请 对 图 5-8 和 图 5-10 中 的 硬件 进行 修改 以 实现 这 些 指 令 。 
解答 : 图 5-28 给 出 了 一 种 可 能 的 结构 。 为 了 保存 IPS 的 内 容 ， 我 们 将 其 输出 端 与 MuxY 新 增 的 输入 
端 相连 。 而 在 恢复 其 内 容 时 ，MuxIPS 会 选择 寄存 器 RA。 





图 5-28 例 5.6 中 IPS 的 连接 


习题 
[M] 5.1 图 5-2 中 ,组 合 电 路 的 传播 延迟 为 600 ps ( 皮 秒 : 10“ 秒 )。 寄 存 器 的 准备 时 间 需 要 50 ps， 从 时 
钟 输入 端 到 Q 输出 端的 最 大 传播 延迟 为 70 ps。 
(a ) 如 果 该 电路 正确 操作 ， 则 其 最 小 时 钟 周期 是 多 少 ? 
(b ) 假设 该 电路 被 重新 组 织 为 图 5-3 中 的 三 个 阶段 ， 这 样 该 组 合 电路 在 每 个 阶段 的 延迟 是 
200 ps。 请 问 这 种 情况 下 最 小 的 时 钟 周 期 是 多 少 ? 
[M] 5.2 在 读 取 指 令 
Load R6, 1000 (R9 ) 
时 ，R6 和 R9 中 的 值 分 别 为 4200 和 85320。 存 储 单元 86320 中 的 值 是 75900。 请 给 出 在 该 指令 五 
个 执行 步 的 每 一 步 中 ， 图 5-8 中 段 间 寄 存 器 的 内 容 。 
[E] 5.3 图 5-12 给 出 了 不 同 指令 组 其 寄存 器 地 址 的 位 字段 分 配 情况 。 为 什么 所 有 的 指令 要 使 用 相同 的 字 
段位 置 ? 
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[M] 5.4 在 程序 执行 的 某 个 时 刻 ， 寄 存 器 R4，R6 和 R7 中 的 值 分 别 为 1000，7500 和 2500。 请 给 出 在 读 

取 并 执行 指令 
Subtract R6, R4, R7 

的 第 3 步 至 第 5 步 以 及 读 取 下 一 条 指令 的 第 1 步 时 ， 寄 存 器 RA、RB 、RZ、RY 和 R6 的 内 容 。 

[M] 5.5 指令 

And R4, R4, R8 

存放 在 存储 单元 0x37C00 处 。 在 读 取 该 指令 时 ， 寄 存 器 R4 和 R8 的 值 分 别 为 0x1000 和 
0xB2500。 请 给 出 图 5-8 和 图 5-10 中 该 指令 执行 的 每 个 时 钟 周期 以 及 下 一 条 指令 的 第 一 个 时 钟 周 
期 中 ， 寄 存 器 PC、R4、RA、RM、RZ 和 RY 的 值 。 

[D] 5.6 修改 例 5.3 中 的 表达 式 ， 以 比较 两 个 用 补 码 形式 表示 的 4 位 有 符号 数 。 

[E] 5.7 第 2 章 所 描述 的 子 程序 调用 指令 总 是 使 用 相同 的 通用 寄存 器 LINK 来 保存 返回 地 址 。 因 此 ， 指 令 
中 不 包含 返回 寄存 器 的 地 址 。 然 而 ， 在 子 程序 返回 指令 中 ， 地 址 LINK 却 包含 在 位 IRi -zy 中 ( 参 
见 5.4.1 节 和 例 5.4 )。 为 什么 这 两 条 指令 会 有 这 样 的 区 别 ? 

[M] 5.8 对 于 具有 例 5.5 所 示 中 断 结 构 的 处 理 器 ， 请 给 出 其 Return-from-interrupt 指令 的 执行 步骤 序列 。 假 
设 寄存 器 IRA 的 地 址 在 指令 的 位 IRi -> 中 给 出 。 

[D] 5.9 考虑 一 个 指令 集 ， 其 指令 的 编码 方式 使 得 不 同 指令 的 寄存 器 地 址 并 不 总 在 相同 的 位 位 置 中 。 请 问 
这 会 对 指令 的 执行 步骤 造成 什么 影响 ? 在 这 种 情况 下 ， 应 该 怎样 做 才能 保持 五 步 的 执行 序列 ? 假 
设 使 用 与 图 5-8 相同 的 硬件 结构 。 

[M] 5.10 假设 立即 操作 数 占据 指令 的 IRz -es 位 。 该 立即 值 在 算术 运算 指令 中 被 符号 扩展 为 32 位， 如 Add 
指令 ; 在 逻辑 运算 指令 中 被 用 零 填充 为 32 位 ， 如 Or 指令。 请 为 图 5-9 中 的 立即 数 模块 设计 一 


种 合适 的 实现 方式 。 
[M] 5.11 一 个 使 用 图 5-4 中 五 步 序列 的 RISC 处 理 器 是 由 一 个 1 GHz 的 时 钟 驱动 的 。 一 个 大 型 程序 中 的 指 
令 统 计 结 果 如 下 : 
Branch 20% 
Load 20% 
Store 10% 


计算 型 指令 50% 
请 预测 在 下 面 每 一 种 情况 中 指令 执行 的 速率 : 
(a ) 存储 器 访问 始终 在 1 个 时 钟 周期 内 完成 。 
(b ) 90% 的 取 指令 操作 在 一 个 时 钟 周期 内 完成 ， 另 外 10% 则 需要 4 个 时 钟 周期 。 而 Load 或 
Store 指令 中 的 数据 操作 数 访问 则 平均 在 3 个 时 钟 周期 内 完成 。 

[E] 5.12 计算 型 指令 的 执行 按照 图 5-11 中 Add 指令 的 模式 进行 ， 其 中 在 第 4 步 中 没有 执行 任何 操作 。 考 
虑 一 个 程序 ， 其 指令 统计 结果 在 习题 5.11 中 给 出 。 请 估 测 在 取消 第 4 步 的 情况 下 ， 指 令 执 行 速 
率 的 提升 效果 。 假 设 所 有 的 执行 步 都 在 一 个 时 钟 周期 内 完成 。 

[D] 5.13 图 5-16 显示 ， 条 件 转移 指令 的 第 3 步 可 能 会 使 得 一 个 新 值 被 装 人 PC 中 。 在 流水 线 处 理 器 中 ， 
我 们 希望 在 执行 序列 中 尽早 确定 条 件 转移 的 结果 。 请 问 需要 对 硬件 进行 什么 样 的 改变 才 可 以 把 
第 3 步 的 操作 移 到 第 2 步 中 ? 分 析 这 两 步 中 的 每 一 个 操作 ， 并 说 明 哪 些 操作 可 以 并 行 执行 ， 哪 
些 操 作 必须 顺序 执行 。 

[M] 5.14 某 计 算 机 指令 的 编码 方式 如 图 5-12 所 示 。 当 指令 中 给 出 一 个 立即 值 的 时 候 ， 它 必须 被 扩展 为 32 
位 。 假 设 该 立即 值 有 以 下 三 种 不 同 的 使 用 方式 : 
(a) 16 位 的 值 ， 被 符号 扩展 ， 用 于 算术 运算 。 
(b ) 16 位 的 值 ， 左 边 用 零 填 充 ， 用 于 逻辑 运算 。 
(c) 26 位 的 值 ， 右 边 填充 2 个 零 ， 左 边 用 PC 的 4 个 高 位 进行 扩展 ， 用 于 子 程序 调用 指令 。 
请 给 出 图 5-19 中 立即 数 模块 的 一 种 实现 方式 以 完成 上 述 所 需 的 扩展 操作 。 

[E] 5.15 我 们 已 经 知道 RISC 风格 的 指令 可 以 在 图 5-8 的 多 阶段 硬件 中 用 图 5-4 所 示 的 步骤 来 执行 。RISC 
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风格 的 指令 集中 不 包括 自动 增 量 和 自动 减 量 寻 址 方式 。 请 解释 指令 
Load R3,( RS ) + 
为 什么 不 能 在 图 5-8 的 硬件 中 执行 。 
[E] 5.16 2.9 节 描 述 了 如 何 使 用 Or 和 OrHigh 两 条 指令 来 将 一 个 32 位 的 值 装 和 寄存 器 中 。 请 问 为 了 实现 
OrHigh 指令 ， 还 需要 在 处 理 器 的 数据 通路 中 新 增 哪 些 功能 ?请 给 出 读 取 及 执行 该 指令 的 动作 序 
列 。 
[E] 5.17 在 指令 处 理 的 第 1 步 中 ， 启动 一 个 存储 器 读 操 作 以 读 取 在 存储 单元 0x46000 处 的 指令 。 然 而 ， 
由 于 在 高 速 缓存 中 没有 找到 该 指令 ， 所 以 该 读 操作 被 延迟 ，MEFC 信号 直到 第 四 个 时 钟 周期 才 被 
激活 。 假 设 该 延迟 按 5.6.2 节 中 所 述 的 方式 进行 处 理 。 请 分 别 给 出 在 第 1 步 的 四 个 时 钟 周期 中 以 
及 第 2 步 中 PC 的 内 容 。 
[M] 5.18 请 给 出 读 取 并 执行 例 5.6 中 所 使 用 的 两 条 特殊 指令 
MoveControl Ri, IPS 
和 
MoveControl IPS, Ri 
的 步骤 序列 - 
[D] 5.19 图 5-8 和 图 5-22 的 硬件 结构 之 间 的 本 质 区 别 是 什么 ?通过 确定 在 图 5-8 所 示 的 硬件 中 执行 指令 
Subtract LOC, RS 
时 可 能 会 遇 到 的 困难 来 说 明 你 的 答案 。 该 指令 执行 以 下 操作 : 
LOC ~ [LOC]- [RS5] 
其 中 ，LOC 是 一 个 存储 单元 ， 其 地 址 由 一 条 双 字 指令 的 第 二 个 字 给 出 。 
[M] 5.20 考虑 执行 5.4.1 节 给 出 的 指令 所 需 的 动作 。 对 于 这 些 指令 ， 请 推导 出 生成 图 5-18 和 图 5-19 中 的 
C _ select、MA_select 和 Y_select 信和 号 的 逻辑 表达 式 。 
[E] 5.21 为 什么 在 5.6.2 节 所 给 出 的 Counter_enable 的 逻辑 表达 式 中 需要 同时 包含 WMFC 和 MFC 两 个 信 
号 ? 
[E] 5.22 请 说 明 如 果 将 5.6.2 节 所 给 出 的 PC_enable 表达 式 中 的 MFC 变量 省 略 掉 ， 会 发 生 什么 情况 ? 
[M] 5.23 请 推导 出 生成 图 5-20 所 示 的 PC_select 和 INC select 信号 的 逻辑 表达 式 ， 考 虑 执行 以 下 指令 所 
需 的 操作 
Branch: 所 有 转移 指令 ， 其 中 每 条 指令 都 包括 一 个 16 位 的 转移 偏 移 量 
Call_register: 子 程序 调用 指令 ， 其 子 程序 的 地 址 在 一 个 通用 寄存 器 中 给 出 
其 他 : 所 有 不 包含 转移 的 其 他 指令 
[M] 5.24 一 个 微 程序 处 理 器 具有 如 下 参数 。 生 成 一 条 指令 的 微 例 程 起 始 地 址 需要 2.1ns， 从 控制 存储 器 中 
读 取 一 条 微 指 令 需 要 1.5ns。 执 行 一 次 ALU 运算 最 多 需要 2.2ns， 访问 高 速 缓存 需要 1.7ns。 假 
设 所 有 的 指令 和 数据 都 在 高 速 缓存 中 。 
(a ) 请 确定 图 5-26 中 的 每 一 步 所 需要 的 最 小 时 间 。 
(b) 忽略 所 有 其 他 延迟 ， 该 处 理 器 可 使 用 的 最 小 时 钟 周期 是 多 少 ? 
[M] 5.25 请 给 出 在 图 5-24 所 示 的 处 理 器 中 读 取 并 执行 指令 
Load R3,(R5 ) + 
的 步骤 序列 。 假 设 操作 数 是 32 位 。 
[M] 5.26 一 个 CISC 风格 的 处 理 器 将 子 程序 的 返回 地 址 保存 在 处 理 器 堆栈 中 ， 而 不 是 在 预先 定义 的 寄存 
器 LINK 中 。 请 给 出 在 图 5-24 所 示 的 处 理 器 中 执行 Call_register 指令 的 动作 序列 。 
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本 章 目标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 通过 重 笃 执 行 机 器 指令 来 提高 性 能 的 流水 线 方式 

e 限制 流水 线 处 理 器 性 能 提升 的 冲突 ( hazard ) 以 及 降低 冲突 影响 的 方法 

e 流水 线 中 的 硬件 和 软件 含义 

e 流水 线 对 指令 集 设计 的 影响 

e 超标 量 处 理 器 

第 5 章 介 绍 了 一 次 执行 一 条 指令 的 处 理 器 结构 。 在 本 章 中 ， 我们 将 讨论 流水 线 的 概念 ， 
它 重 倒 执行 连续 的 指令 ， 以 获取 更 高 的 性 能 。 我 们 首先 阐述 流水 线 的 基本 知识 以 及 它 是 如 何 提 
高 性 能 的 。 然 后 研究 导致 性 能 下 降 的 冲突 以 及 减轻 它们 对 性 能 影响 的 技术 。 我 们 讨论 优化 编译 
器 ( optimizing compiler ) 的 作用 ， 它 可 以 重新 排列 指令 序列 以 使 流水 线 的 效益 最 大 化 。 为 进 一 
步 提 高 性 能 ， 我 们 还 考虑 在 超标 量 ( superscalar ) 处 理 器 中 复制 硬件 设备 ， 这 样 多 个 流水 线 可 
以 同时 操作 。 


6.1 基本 概念 一 一 理想 情况 

程序 执行 的 速度 受到 许多 因素 影响 。 提 高 性 能 的 一 种 方法 是 利用 快速 电路 技术 来 实现 处 
理 嚣 和 主 存储 器 ， 男 一 种 可 能 是 对 硬件 进行 合理 地 安排 ,使 其 能 同时 执行 多 项 操作 。 采 用 后 一 
种 方法 ， 即 使 执行 任何 一 个 操作 所 需 的 时 间 不 变 , 但 是 每 秒 钟 执行 操作 的 数目 也 会 增加 。 

在 计算 机 系统 中 ， 流 水 线 是 组 织 并 发 活动 的 一 种 非常 有 效 的 方法 ， 它 的 基本 思想 很 简单 。 
在 制造 工厂 里 经 常会 看 到 流水 线 ， 那 里 的 流水 线 通 常 是 作为 装配 线 操作 的 。 毫 无 疑问 ， 读 者 对 
汽车 制造 中 用 到 的 装配 线 是 很 熟悉 的 。 装 配 线 的 第 一 站 准备 汽车 底盘 ， 第 二 站 增加 车 身 ， 下 一 
站 安装 发 动机 等 。 当 一 组 工人 在 一 辆 汽车 上 安装 发 动机 时 ， 另 一 组 人 在 第 二 辆 汽车 的 底盘 上 安 
装 车 身 ， 还 有 一 组 人 为 第 三 辆 汽车 准备 新 的 底盘 。 虽 然 完 成 一 辆 汽车 可 能 会 花费 几 小 时 或 几 天 
的 时 间 ， 但 是 装配 线 操作 使 得 每 隔 几 分 钟 就 有 一 辆 新 车 从 装配 线 的 末端 开 出 来 。 

让 我们 考虑 一 下 流水 线 的 思想 如 何 能 用 于 计算 机 中 。 图 5-7 中 的 五 阶段 处 理 器 结构 以 及 
图 5-8 中 相应 的 数据 通路 允许 一 次 提取 并 执行 一 条 指令 。 完 成 每 条 指令 的 执行 需要 花费 五 个 
时 钟 周期 。 我 们 不 需要 等 到 每 条 指令 都 执行 完成 才 去 提取 和 执行 其 他 指令 ， 而 是 可 以 用 图 6-1 
所 示 的 流水 线 方式 来 提取 并 执行 指令 。 这 五 个 阶段 对 应 于 图 5-7 中 的 五 个 阶段 ， 标 记 为 取 指 
(Fetch )、 译 码 (Decode )、 计 算 (Compute )、 访 存 (Memory ) 和 写 回 ( Write )。 在 第 一 个 周 
期 中 ， 提 取 指 令 0T， 它 将 在 接 下 来 的 周期 中 经 过 剩 下 的 阶段 。 在 第 二 个 周期 中 ， 提 取 指令 Li， 
而 指令 了 现在 处 于 译 码 阶段 ， 同 时 它 的 操作 数 正 在 从 寄存 器 文件 中 读 取 。 在 第 三 个 周期 中 ， 提 
取 指 令 fa ， 而 指令 Li 现在 处 于 译 码 阶段 ， 指 令 了 T 处 于 计算 阶段 ， 正 在 对 它 的 操作 数 进行 一 个 
算术 或 逻辑 运算 。 最 理想 的 是 ， 这 种 重 芋 执行 的 模式 对 所 有 指令 都 是 可 能 的 。 虽 然 任 何 一 条 指 
令 需要 花费 五 个 周期 才能 完成 它 的 执行 ， 但 是 指令 是 按 每 个 周期 一 条 的 速率 完成 的 。 
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时 钟 周期 1 2 3 4 5 6 2 
L 
Le 
图 6-1 指令 的 流水 线 执行 一 一 理想 情况 
流水 线 结构 


图 6-2 显示 了 如 何 对 图 5-7 和 图 5-8 中 的 五 阶段 结构 实现 流水 线 。 在 流水 线 的 第 一 个 阶 


段 ， 程 序 计数 器 (PC ) 用 于 提取 一 条 新 的 指 
令 。 当 提取 其 他 指令 时 ， 前 一 条 指令 通过 后 续 
的 阶段 继续 执行 。 在 任何 时 间 ， 流 水 线 的 每 个 
阶段 都 在 处 理 不 同 的 指令 。 随 着 每 条 指令 从 一 
个 阶段 进行 到 下 一 个 阶段 ， 诸 如 寄存 器 地 址 、 


立即 数据 和 将 要 执行 的 操作 之 类 的 信息 必须 也 
被 传送 通过 流水 线 。 这 些 信息 被 保存 在 段 间 组 一 
冲 器 (interstage buffer ) 中 ， 这 些 缓冲 器 包括 
图 5-8 中 的 寄存 器 RA、RB、RM、RY 和 RZ， 
图 5-9 和 图 5-10 中 的 人 迟 和 PC-Temp 寄存 器 ， 
以 及 辅助 存储 器 。 段 间 缓 冲 器 使 用 如 下 

。 段 间 缓 冲 器 B1 向 译 码 阶段 提供 一 条 新 





段 间 缓冲 器 Bl 



















提取 的 指令 . 

段 间 缓冲 器 B2 向 计算 阶段 提供 从 寄存 
器 文件 中 读 取 的 两 个 操作 数 、 源 /目标 
寄存 器 标识 符 、 来 自 指令 的 立即 值 、 用 
作 子 程序 调用 返回 地 址 的 递增 后 的 PC 


二 
值 ， 以 及 由 指令 译 码 器 确定 的 控制 信号 


| 和 县 加 绥 站 8B4 | 
的 设置 值 。 控 制 信号 的 设置 值 穿 过 流水 


线 以 确定 ALU 运算 、 存 储 器 操作 以 及 数据 通路 操作 | 源 / 目标 寄存 器 标识 | 不 同 阶段 的 
一 个 可 能 的 写 人 寄存 器 文件 的 操作 。 En 
段 间 缓冲 器 B3 保存 ALU 运算 的 结果 ， 图 6-2 一 条 5 段 流水 线 

它 可 能 是 即将 写 入 寄存 器 文件 的 数据 或 者 是 送 入 访 存 阶段 的 一 个 地 址 。 在 对 存储 器 进 
行 写 访问 时 ， 缓 冲 器 B3 里 保存 着 要 写 入 的 数据 ， 这 些 数据 是 在 译 码 阶 段 从 寄存 器 文件 
中 读 取 的 。 缓 冲 器 中 还 保存 从 前 一 阶段 传递 过 来 的 递增 后 的 PC 值 ， 以 防 需要 它 作为 子 
程序 调用 指令 的 返回 地 址 。 

段 间 缓冲 器 B4 向 写 回 阶段 提供 一 个 即将 写 人 寄存 器 文件 的 值 ， 这 个 值 可 能 是 计算 阶段 
的 ALU 运算 结果 ， 也 可 能 是 存储 器 访问 阶段 的 结果 ， 或 者 是 用 作 子 程序 调用 指令 返回 


段 间 缓冲 器 B3 
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地 址 的 递增 后 的 PC 值 。 


6.3 ”流水线 问题 

图 6-1 描述 了 三 条 连续 指令 的 理想 重 释 情况。 但 是 ， 有 些 时 候 不 可 能 每 个 周期 都 有 一 条 新 
的 指令 进入 流水 线 。 考 虑 两 条 指令 和 .i 的 情况 ， 其 中 指令 1 的 目标 寄存 器 是 指令 1 的 一 
个 源 寄存 器 。 指 令 0 的 结果 直到 第 5 个 周期 才 写 人 寄存 器 文件 ， 但 它 早 在 第 3 个 周期 为 指令 
1 读 取 源 操作 数 时 就 需要 。 如 果 指 令 的 执行 按 图 6-1 所 示 的 那样 进行 ,那么 指令 Li 的 结果 将 
是 不 正确 的 ， 因 为 它 将 使 用 其 源 寄存 器 中 的 旧 值 执行 算术 运算 。 为 获得 正确 的 结果 ， 需 要 等 到 
指令 了 将 新 值 写 人 寄存 器 中 。 因 此 ， 指 令 L, 直到 第 6 个 周期 才能 读 取 它 的 操作 数 ， 这 意味 着 
它 必须 在 译 码 阶 段 被 暂停 ( stall ) 3 个 周期 。 当 指令 Li 被 暂停 时 ， 指 令 It 和 所 有 后 续 指 令 也 
同样 被 延迟 。 新 的 指令 不 能 进入 流水 线 ， 总 的 执行 时 间 也 将 增加 。 

我 们 称 这 种 引起 流水 线 暂 停 的 情况 为 冲突 (hazard )。 我 们 刚刚 描述 的 是 一 个 数据 冲突 
( data hazard ) 的 例子 ， 如 果 一 条 指令 的 一 个 源 操作 数 的 值 在 需要 的 时 候 不 能 获得 就 会 引起 这 种 
冲突 。 还 有 其 他 由 存储 器 延迟 、 转 移 指 令 和 资源 限制 产生 的 冲突 。 接 下 来 的 几 节 我 们 将 详细 描 
述 这 些 冲突 以 及 降低 它们 对 性 能 影响 的 技术 。 


6.4 数据 依赖 性 
考虑 图 6-3 中 的 两 条 指令 : 
Add R2, R3, #100 
Subtract R9, R2, #30 


Add 指令 的 目标 寄存 器 R2 是 Subtract 指令 的 一 个 源 操作 数 。 在 这 两 条 指令 间 存 在 数据 依赖 性 
( data dependency )， 因 为 寄存 器 R2 将 数据 从 第 一 条 指令 传输 到 第 二 条 指令 。 图 6-3 描述 了 这 
两 条 指令 的 流水 线 执行 情况 。Subtract 指令 被 暂停 了 3 个 周期 ， 直 到 第 6 个 周期 可 以 获得 新 数 
据 时 才 延 迟 读 取 寄存 器 R2 的 内 容 。 

我 们 现在 详细 解释 流水 线 停顿 。 当 控制 电路 在 第 3 个 周期 译 码 Subtract 指令 时 ， 它 必须 先 
识别 出 数据 依赖 性 ， 这 可 以 通过 将 保存 在 段 间 缓冲 器 B1 中 的 Subtract 指令 的 源 寄存 器 标识 符 
与 保存 在 段 间 缓冲 器 B2 中 的 Add 指令 的 目标 寄存 器 标识 符 进行 比较 来 识别 。 然 后 ， 在 第 3 个 
周期 到 第 5 个 周期 期 间 ，Subtract 指令 必须 保持 在 段 间 缓冲 器 Bl 中 。 与 此 同时 ，Add 指令 继 
续 通 过 剩 下 的 流水 线 阶 段 。 在 第 3 个 周期 到 第 5 个 周期 中 ， 随 Add 指令 向 前 移动 ， 可 以 在 段 
间 缓 冲 器 B2 中 设置 一 条 隐 含 的 NOP ( 空 操作 ) 指令 控制 信号 ， 它 不 会 修改 存储 器 或 寄存 器 文 
件 。 每 条 NOP 指令 通过 计算 、 访 存 和 写 回 阶段 到 达 流 水 线 终端 时 ， 就 产生 了 一 个 空闲 时 间 的 
时 钟 周期 ， 称 为 气泡 ( bubble )。 


一 一 时 间 
时 钟 周期 人 
Adad ppmo [ED cxMTw 
sm km [Fl|D clwlw 


图 6-3 由 于 数据 依赖 性 而 产生 的 流水 线 停顿 


6.4.1 操作 数 转发 
由 于 数据 依赖 性 而 产生 的 流水 线 停顿 可 以 通过 使 用 操作 数 转 发 ( operand forward ) 技术 来 
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缓解 。 考 虑 上 面 讨论 的 那 对 指令 ， 流 水 线 被 暂停 了 3 个 周期 后 Subtract 指令 才 可 以 使 用 寄存 
器 R2 中 的 新 值 。 然 而 ， 实 际 上 所 需 的 值 在 第 3 个 周期 的 末尾 就 可 用 了 ， 那 时 ALU 已 经 完成 
了 Add 指令 的 操作 。 这 个 值 被 装 入 图 5-8 中 的 寄存 器 RZ 中 ，RZ 是 段 间 缓冲 器 B3 的 一 部 分 。 
硬件 可 以 将 这 个 值 从 寄存 器 RZ 中 转发 至 第 4 个 周期 中 需要 它 的 地 方 ， 也 就 是 ALU 的 输入 端 ， 
而 不 必 延 迟 Subtract 指令 。 图 6-4 显示 了 实现 操作 数 转发 时 指令 的 流水 线 执行 情况 。 箭 头 表示 
第 3 个 周期 的 ALU 结果 被 作为 第 4 个 周期 中 ALU 的 一 个 输入 端 使 用 。 


一 -~ 时 间 


时 钟 周期 1 


2 3 4 3 6 
Mammo [rlPicl™mivw) 
sme RoR2m0 [rp|clwlw 


图 6-4 ”使 用 操作 数 转发 来 避免 流水 线 停顿 


图 6-5 对 图 5-8 中 的 数据 通路 进行 必要 的 修 
改 ， 以 支持 这 种 转发 机 制 。 一 个 新 的 多 路 复 用 器 
MuxA 插入 到 了 ALU 的 输入 端 InA 之 前 ， 而 已 有 
的 多 路 复 用 器 MuxB 扩展 出 了 另 一 个 输入 端 。 这 
两 个 多 路 复 用 器 要 么 选择 按 正常 方式 从 寄存 器 文 
件 中 读 取 的 值 ， 要 么 选择 寄存 器 RZ 中 的 可 用 值 。 

引申 一 下 ， 图 5-8 中 寄存 器 RY 所 保存 的 结 
果 可 能 也 需要 进行 转发 。 比 如 在 下 列 指令 序列 中 
就 可 以 通过 这 种 方式 进行 处 理 : 






C 


寄存 器 文件 





Add R2, R3, #100 
Or R4, R5, R6 
Subtract R9, R2, #30 


当 Subtract 指令 处 于 流水 线 的 计算 阶段 时 ，Or 指 
令 处 于 访 存 阶段 (不 执行 任何 操作 )，Add 指令 
处 于 写 回 阶段 。 由 Add 指令 产生 的 寄存 器 R2 的 
新 值 现在 在 寄存 器 RY 中 ， 将 这 个 值 从 寄存 器 RY 
转发 到 ALU 的 输入 端 InA 则 可 以 避免 暂停 流水 
线 。 为 此 MuxA 需要 男 一 个 RY 值 作为 输入 ， 同 
样 ，MuxB 也 用 另 一 个 输入 端 进行 扩展 。 


6.4.2 ”用 软件 处 理 数 据 依赖 性 图 6-5 修改 图 5-8 中 的 数据 通路 ， 以 支持 数 

图 6-3 和 图 6-4 显示 了 通过 处 理 器 硬件 来 处 据 从 寄存 器 RZ 转发 至 ALU 的 输入 端 
理 数 据 依赖 性 的 方法 : 暂停 流水 线 或 者 转发 数据 。 男 一 种 方法 是 将 检测 和 人 处理 数据 依赖 性 的 任 
务 留 给 编译 器 。 当 编译 器 识别 出 在 指令 IL 和 1 之 间 存 在 数据 依赖 性 时 ， 它 会 在 这 两 条 指令 
之 间 插 入 3 条 显 式 的 NOP ( 空 操作 ) 指令 。NOP 指令 引入 了 必要 的 延迟 ， 使 得 指令 1, 能 够 
在 寄存 器 文件 被 写 人 后 再 从 其 中 读 取 新 的 值 。 对 于 图 6-4 中 的 指令 ， 编 译 器 将 生成 图 6-6a 中 
的 指令 序列 ， 从 图 6-6b 可 以 看 出 3 条 NOP 指令 在 执行 时 间 上 与 图 6-3 中 的 流水 线 停顿 有 相 
同 的 效果 - 
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利用 编译 器 识别 依赖 性 并 插入 NOP 指令 简化 了 流水 线 的 硬件 实现 。 但 是 ， 代 码 长 度 增加 
了 ， 并 且 执 行 时 间 没 有 像 使 用 操作 数 转发 时 那样 减少 。 编 译 器 可 以 尝试 优化 (optimize ) 代码 
以 提高 性 能 ， 并 通过 重新 排序 指令 ， 将 有 用 的 指令 移 到 NOP 槽 中 来 减少 代码 长 度 。 这 样 做 时 ， 
编译 器 必须 考虑 指令 间 的 数据 依赖 性 ， 这 限制 了 NOP 槽 可 以 被 有 效 填充 的 程度 。 
Add R2, R3,#100 


NOP 
NOP 


NOP 
Subtract  R9, R2, #30 





a) 由 于 数据 依赖 性 而 插入 NOP 指令 


ee 1 于 和 下 


2 3 
Add R2,R3,#I00 | FE | D|clxl|w| 


wor ToTeTvwIw 
vor TT eTwTw 
NOP Cpclalw 
Subtract R9, R2, #30 [| FE|pDp|lclxlw 
b) 指令 的 流水 线 执行 
图 6-6 使 用 NOP 指令 从 软件 上 处 理 数据 依赖 性 
6.5 存储 器 延迟 


由 存储 器 访问 而 产生 的 延迟 是 流水 线 停顿 的 另 一 个 原因 。 例 如 ， 一 条 Load 指令 可 能 需要 
多 个 时 钟 周期 来 从 存储 器 中 获取 它 的 操作 数 。 当 所 请 求 的 指令 或 数据 在 高 速 缓存 中 没有 找到 ， 
即 高 速 缓存 失效 ( cache miss ) 时 就 会 发 生 这 种 情况 。 图 6-7 显示 了 在 流水 线 执行 过 程 中 访问 
存储 器 中 数据 所 产生 延迟 的 影响 。 一 次 存储 器 访问 可 能 需要 花费 10 个 或 更 多 的 周期 ， 为 简单 
起 见 ， 图 中 只 显示 了 3 个 周期 。 高 速 缓存 失效 会 导致 所 有 后 续 的 指令 被 延迟 ， 取 指令 时 高 速 组 
存 失效 会 引起 类 似 的 延迟 。 


一 一 > 时 间 


时 钟 周期 1 2 3 4 5 6 7 8 9 
jim my [ET TW 

Lj Flplc ww 

42 Irlp TJclwlw| 


图 6-7 Load 指令 中 由 存储 器 访问 延迟 引起 的 停顿 
还 有 另外 一 种 与 存储 器 有 关 的 停顿 ， 当 存在 涉及 Load 指令 的 数据 依赖 性 时 会 发 生 。 考 虑 


指令 : 
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Load R2, (R3) 
Subtract R9, R2, #30 
假设 Load 指令 的 数据 可 以 在 高 速 缓存 中 找到 ， 那 么 只 需要 一 个 周期 来 访问 操作 数 。 而 Load 
指令 的 目标 寄存 器 R2 是 Subtract 指令 的 一 个 源 寄存 器 。 这 里 不 能 用 图 6-4 所 示 的 同样 的 方式 
来 进行 操作 数 转 发 ， 因 为 从 存储 器 ( 在 本 例 中 是 高 速 缓存 ) 中 读 取 的 数据 直到 它们 在 第 5 个 
周期 的 开始 处 被 装 入 寄存 器 RY 时 才 可 用 。 因 此 ，Subtract 指令 必须 被 暂停 一 个 周期 ， 以 推迟 
ALU 操作 ， 如 图 6-8 所 示 。 在 第 5 个 周期 存储 器 操作 数 已 装 入 寄存 器 RY 中 之 后 才 可 以 将 其 转 
发 到 ALU 的 输入 端 。 
一 > 时 间 
时 钟 周期 
Load R2,(R3) 





图 6-8 为 了 向 跟 在 Load 指令 之 后 的 指令 转发 操作 数 ， 需 要 引入 停顿 


编译 器 可 以 为 这 种 类 型 的 数据 依赖 性 消除 这 一 个 周期 的 停顿 ， 对 指令 进行 重新 排序 ， 在 
Load 指令 和 依赖 于 存储 器 数据 的 指令 之 间 插 入 一 条 有 用 的 指令 即 可 。 这 条 插入 的 指令 将 填充 
本 来 会 产生 的 那个 气泡 。 如 果 编 译 器 找 不 到 一 条 有 用 的 指令 ， 那 么 硬件 将 自动 引入 一 个 周期 的 
停顿 。 如 果 处 理 器 硬件 不 能 处 理 依赖 性 ， 那 么 编译 器 就 必须 插入 一 条 显 式 的 NOP 指令 。 


6.6 ”转移 延迟 

在 理想 的 流水 线 执行 中 ， 每 个 周期 提取 一 条 新 指令 ， 而 前 面 一 条 指令 还 在 译 码 中 。 转 移 
指令 会 改变 执行 的 顺序 ， 但 它们 必须 先 被 执行 ， 以 确定 是 否 转移 以 及 转移 到 哪里 。 我 们 现在 研 
究 转移 指令 的 影响 以 及 用 于 减轻 转移 指令 对 流水 线 执行 的 影响 的 技术 -。 


6.6.1 无 条 件 转移 


图 6-9 显示 了 一 个 指令 序列 的 流水 线 执 行 ， 该 序列 从 一 条 无 条 件 转移 指令 了 开始 。 接 下 
来 的 两 条 指令 ft 和 LI 存储 在 了 之 后 的 连续 存储 器 地 址 中 。 转 移 目标 是 指令 K。 根 据 图 5-15， 
在 第 1 个 周期 提取 转移 指令 ， 然 后 在 第 2 个 周期 对 其 进行 译 码 ,在 第 3 个 周期 计算 目标 地 址 。 
因此 ， 在 用 目标 地 址 更 新 程序 计数 器 后 ， 在 第 4 个 周期 提取 指令 I。 在 流水 线 执行 中 ， 在 转移 
指令 被 译 码 、 确 定 目标 地 址 之 前 ， 第 2 和 第 3 个 周期 就 已 分 别提 取 了 指令 It 和 Iaz。 这 两 条 指 
令 必须 被 丢弃 ， 而 由 此 产生 的 两 个 周期 延迟 构成 了 转移 代价 ( branch penalty )。 

转移 指令 会 经 常 出 现 。 实 际 上 ， 转 移 指令 大 约 占 大 多 数 程序 中 动态 指令 数 的 20% ( 动态 
数 是 指 实际 执行 的 指令 数量 ， 考 虑 到 程序 中 有 些 指令 由 于 循环 而 执行 很 多 次 的 情况 )。 由 于 转 
移 代 价 有 两 个 周期 ， 所 以 如 果 程 序 中 转移 指令 的 频率 较 高 的 话 会 使 程序 的 执行 时 间 增 加 高 达 
40%。 因 此 ， 找 到 方法 来 减轻 其 对 性 能 的 影响 非常 重要 。 

为 了 减少 转移 代价 ， 应 该 在 流水 线 中 较 早 地 计算 出 转移 目标 地 址 。 在 译 码 阶段 是 有 可 能 
确定 目标 地 址 并 更 新 程序 计数 器 的 ， 而 不 需要 等 到 计算 阶段 。 这 样 ， 指 令 I 可 以 提前 一 个 时 钟 
周期 提取 ， 将 转移 代价 减少 到 一 个 周期 ， 如 图 6-10 所 示 。 这 时 ， 只 有 一 条 指令 IN 被 错误 地 提 
取 ， 因 为 目标 地 址 是 在 译 码 阶段 确定 的 。 

为 了 实现 这 个 变化 ， 必 须 对 图 5-10 中 的 硬件 进行 修改 。 图 中 的 加 法 器 需要 在 每 个 周期 增 
加 PC 的 值 。 在 译 码 阶段 需要 第 二 个 加 法 器 为 每 条 指令 计算 转移 目标 地 址 。 当 指令 译 码 器 确定 
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指令 确实 是 一 条 转移 指令 时 ， 第 二 个 加 法 器 在 这 个 周期 结束 之 前 就 可 计算 出 目标 地 址 。 然 后 在 
下 个 周期 就 可 以 使 用 该 目标 地 址 去 提取 目标 指令 。 


ER 

rm [rT5T el T 

r | 

" EN A 

' ToTeTwlw| 
| 

图 6-9 在 流水 线 的 计算 阶段 确定 目标 地 址 时 的 转移 代价 





时 名 周期 1 
1 转移 到 
机 END 

转移 代价 


图 6-10 在 流水 线 的 译 码 阶段 确定 目标 地 址 时 的 转移 代价 


6.6.2 条件 转移 

考虑 一 条 条 件 转 移 指令 ， 比 如 : 

Branch if [R5] = [R6] LOOP 

这 条 指令 的 执行 步骤 如 图 5-16 所 示 -。 在 第 三 步 中 的 比较 结果 决定 是 否 进行 转移 。 

对 于 流水 线 来 说 ， 必 须 尽 可 能 早 地 测试 转移 条 件 以 减少 转移 代价 。 我 们 刚刚 找 述 了 一 条 
无 条 件 转移 指令 如 何在 译 码 阶段 确定 目标 地 址 。 同 样 ， 测 试 转 移 条 件 的 比较 器 也 可 以 移 到 译 码 
阶段 ， 使 得 在 确定 目标 地 址 的 同时 做 出 条 件 转移 决策 。 在 这 种 情况 下 ， 比 较 器 直接 使 用 寄存 器 
文件 的 输出 端 A 和 B 的 值 。 

将 转移 决策 移 到 译 码 阶段 保证 了 所 有 转移 指令 都 只 有 一 个 周期 的 转移 代价 。 在 接 下 来 的 
两 节 中 ， 我 们 将 介绍 另外 的 技术 来 进一步 减轻 转移 对 执行 时 间 的 影响 。 


6.6.3 ”转移 延迟 模 


考虑 图 6-11a 所 示 的 程序 片段 。 假 设 转移 目标 地 址 和 转移 决策 在 译 码 阶段 确定 ， 同 时 提取 
指令 Iris 在 评估 转移 条 件 后 ， 转 移 指 令 可 能 会 导致 指令 ft 被 丢弃 。 如 果 条 件 为 真 ， 则 在 提取 
正确 的 目标 指令 前 有 一 个 周期 的 转移 代价 。 如 果 条 件 为 假 ， 则 指令 I++ 被 执行 ， 并 且 没有 转 
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移 代价 。 在 这 两 种 情况 下 ， 紧 跟 在 转移 指令 之 后 的 指令 总 是 被 提取 。 基 于 这 一 观察 ， 我 们 介绍 
一 种 减少 转移 指令 代价 的 技术 。 Se es 

跟 在 转移 指令 后 面 的 单元 被 称 为 转移 延 eh 
迟 (branch delay slot )。 我 们 不 是 有 条 件 地 Lj+1 
丢弃 延迟 槽 中 的 指令 ， 而 是 可 以 合理 安排 以 使 : 
得 无 论 转 移 是 否 发 生 ， 流 水 线 始 终 执 行 这 条 指 TARGET: Ix 
令 。 在 延迟 槽 中 的 指令 不 能 是 1,1,， 因 为 根据 
转移 条 件 它 可 能 被 丢弃 。 相 反 ， 编 译 器 试图 找 
到 一 条 合适 的 指令 占据 延迟 槽 ， 即 使 发 生 转 Branoh mn IR 0 TARGBT 
移 ， 这 条 指令 也 需要 被 执行 。 这 可 以 通过 将 转 er 
移 指令 之 前 的 一 条 指令 移 到 延迟 槽 中 来 完成 。 Ij+l 
当然 ， 只 有 在 保持 被 移动 指令 的 数据 依赖 性 的 : 
前 提 下 才 可 以 这 样 做 。 如 果 能 找到 一 条 有 用 的 TARGET: 1x 
8 令 ， 那 么 将 不 会 有 转移 代价 。 如 果 因 为 数据 
依赖 性 的 限制 而 没有 有 用 的 指令 可 以 放 到 延迟 
槽 中 ， 那 么 必须 改 放 一 条 NOP 指令 在 这 里 。 ”图 611 用 一 条 有 用 的 指令 填充 转移 延迟 楼 
在 这 种 情况 下 ， 不 管 是 否 发 生 转 移 都 将 有 一 个 周期 的 时 间 代价 。 

对 于 图 6-11a 中 的 指令 ，Add 指令 可 以 安全 地 移 到 转移 延迟 槽 中 ， 如 图 6-11b 所 示 。 即 使 
发 生 转 移 ，Add 指令 也 始终 被 提取 并 执行 。 指 令 [+ 只 有 在 不 发 生 转 移 时 才 被 提取 。 人 逻辑 上 ， 
程序 的 执行 继续 进行 就 像 转移 指令 被 放 在 Add 指令 之 后 一 样 。 也 就 是 说 ， 与 转移 指令 在 指令 
序列 中 出 现 的 位 置 相 比 ， 转 移 的 发 生 要 晚 一 条 指令 。 这 种 技术 称 为 延迟 转移 ( delayed branch )。 

延迟 转移 技术 的 有 效 性 取决 于 编译 器 重 排 指令 有 效 填充 延迟 槽 的 频率 。 从 许多 程序 收集 
到 的 实验 数据 表明 ，70% 以 上 的 情况 下 ， 编 译 器 都 可 以 填充 一 个 延迟 模 。 


6.6.4 转移 预测 

上 面 的 讨论 表明 在 执行 转移 指令 的 第 2 个 周期 做 出 转移 决策 可 以 减少 转移 代价 。 但 是 ， 
即便 如 此 ， 紧 跟 在 转移 指令 之 后 的 那 条 指令 仍然 在 第 2 个 周期 被 提取 ， 并 可 能 被 丢弃 。 提 取 这 
条 指令 的 决策 实际 上 是 在 第 1 个 周期 做 出 的 ， 那 时 PC 被 递增 ， 而 转移 指令 本 身 正 在 被 提取 。 
因此 ， 为 了 进一步 减少 转移 代价 ， 处 理 器 需要 预期 即将 取出 的 指令 可 能 是 转移 指令 ， 并 预测 
( predict ) 其 结果 以 确定 应 在 第 2 个 周期 取出 哪 条 指令 。 在 这 一 节 中 ， 我 们 首先 描述 转移 预测 
的 不 同方 法 ， 然后， 我 们 讨论 如 何在 第 1 个 周期 当 转 移 指令 正在 被 提取 的 时 候 做 出 预测 。 

1. 静态 转移 预测 

转移 预测 最 简单 的 形式 是 假设 转移 不 会 发 生 ， 并 按 连续 的 地 址 顺序 提取 下 一 条 指令 。 如 
果 预 测 是 正确 的 ， 则 提取 的 指令 就 可 以 完成 ,并且 没有 时 间 代 价 。 但 是 ， 如 果 预 测 错误 ， 则 已 
提取 的 指令 将 被 丢弃 ， 正 确 的 转移 目标 指令 被 取出 。 预 测 错误 会 引起 转移 代价 。 这 种 简单 的 方 
法 是 静态 转移 预测 ( static branch prediction ) 的 一 种 形式 。 每 次 遇 到 一 个 条 件 转 移 都 采用 相同 
的 选择 〈 假设 转移 不 会 发 生 )。 

如 果 转 移 结果 是 随机 的 ， 那 么 将 有 一 半 的 条 件 转移 会 发 生 。 在 这 种 情况 下 ， 始 终 假 设 转 
移 不 会 发 生 将 有 50% 的 预测 准确 率 。 然 而 ， 循 环 末尾 的 反 向 转移 大 部 分 时 间 会 发 生 。 对 于 这 
样 的 转移 ， 预 测 它 可 能 会 发 生 则 可 以 达到 更 高 的 准确 性 。 因 此 ， 只 要 一 知道 转移 目标 地 址 就 用 
它 来 提取 指令 。 同 样 ， 对 于 循环 开始 处 的 正 向 转移 ， 预 测 转移 不 会 发 生 将 会 产生 较 好 的 预测 准 





a ) 包含 条 件 转移 指令 的 原始 指令 序列 





b ) 将 Add 指令 放 到 转移 延迟 槽 中 ， 它 将 始终 被 执行 
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确 性 。 处 理 器 可 以 通过 检查 转移 偏 移 量 的 符号 来 做 出 转移 发 生 或 者 不 发 生 的 静态 预测 。 另 外 ， 
转移 指令 的 机 器 编码 中 可 能 包含 一 个 位 ， 用 来 表示 应 该 将 该 转移 预测 为 发 生还 是 不 发 生 。 这 个 
位 的 设置 可 以 由 编译 器 指定 。 ng 


2， 动 态 转移 预测 
为 了 进一步 提高 预测 准确 性 ， 我 们 可 以 使 用 “(Tt 0 


实际 的 转移 行为 来 影响 预测 ， 这 就 是 动态 转移 预测 


( dynamic branch prediction )。 处 理 器 硬件 通过 跟踪 一 不 发 生 转移 (BNT ) 
条 转移 指令 每 次 执行 时 的 转移 决策 来 判断 该 转移 发 生 a ) 2 状态 算法 
的 可 能 性 。 BT 


最 简单 的 形式 是 动态 预测 算法 可 以 使 用 转移 指令 
最 近 执 行 的 结果 。 处 理 器 假设 下 一 次 执行 该 指令 时 ， BNT 《人 站 个 
转移 决策 可 能 跟 上 一 次 相同 。 此 算法 可 以 用 图 6-12a 
中 的 2 状态 机 来 描述 。 这 两 个 状态 是 : 


LT: 可 能 发 生 转移 ee 


LNT: 可 能 不 发 生 转 移 
假设 算法 从 状态 LNT 开始 。 当 转移 指令 执行 并 且 .> 0 i 
发 生 转移 时 ， 状 态 机 移 到 状态 LI。 和 否则， 保持 在 状态 
LNT 上 。 下 一 次 遇 到 相同 指令 时 ， 如 果 状 态 机 在 状态 0 
LT， 预 测 为 会 发 生 转移 ， 否 则 预测 为 不 发 生 转移 。 inne 
这 种 简单 的 方案 在 程序 循环 内 部 会 很 好 的 运行 ， ”图 6-12 转移 预测 算法 的 状态 机 表示 
它 只 需要 用 一 个 位 来 表示 转移 指令 的 执行 历史 。 一 旦 进入 循环 ， 控 制 循环 的 转移 指令 的 结果 除 
了 循环 的 最 后 一 遍 之 外 始终 是 相同 的 。 因 此 ， 除 了 最 后 一 遍 ， 转 移 指令 的 每 一 次 预测 都 是 正确 
的 。 最 后 一 遍 的 预测 将 是 错误 的 ， 并 且 转 移 历史 状态 机 也 会 改变 到 相反 的 状态 上 。 不 幸 的 是 ， 
这 意味 着 下 一 次 进入 同样 的 循环 时 ( 假设 存在 多 遍 循 环 )， 第 一 遍 循环 状态 机 会 产生 错误 的 预 
测 。 因 此 ， 同 一 循环 的 重复 执行 在 第 一 遍 和 最 后 一 遍 会 产生 预测 错误 。 
对 执行 历史 保留 更 多 信息 可 以 获得 更 好 的 预测 准确 性 。 采 用 4 状态 的 算法 如 图 6-12b 所 
示 。 这 4 个 状态 是 : 
ST: 极 有 可 能 发 生 
LT: 有 可 能 发 生 
LNT: 可 能 不 发 生 
SNT: 极 有 可 能 不 发 生 
再 假设 算法 的 初始 状态 设置 为 LNT。 执行 转移 指令 后 ， 如 果 确 实 发 生 转 移 ， 那 么 状态 变 
化 到 ST ; 否则， 状态 变化 到 SNT。 随 着 程序 的 执行 ， 多 次 遇 到 同样 的 转移 指令 时 ， 预 测算 法 
的 状态 会 如 图 所 示 发 生变 化 。 如 果 状 态 是 ST 或 者 IT， 那么 预测 为 会 发 生 转移 ， 否 则 ， 预 测 为 
不 会 发 生 转 移 。 
我 们 再 考虑 一 下 当 执 行程 序 循环 时 所 发 生 的 情况 。 假 设 转移 指令 位 于 循环 未 尾 并 且 处 理 
器 将 算法 的 初始 状态 设置 为 LNT。 在 循环 的 第 一 遍 ， 预 测 ( 不 发 生 转移 ) 将 是 错误 的 ， 从 而 
状态 会 变化 到 ST。 在 后 续 所 有 遍 中 ， 预 测 都 将 是 正确 的 ， 除 了 最 后 一 遍 。 那 时 ， 状 态 会 变化 
到 LT。 当 再 一 次 进入 循环 时 ， 在 第 一 遍 ， 预 测 会 发 生 转 移 ， 如 果 有 多 次 迭代 ， 该 预测 会 是 正 
确 的 。 因 此 ， 同 一 循环 的 重复 执行 现在 只 在 最 后 一 遍 会 产生 一 次 预测 错误 。 
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3， 动态 预测 的 转移 目标 缓冲 区 

在 前 面 的 讨论 中 ， 我 们 指出 ， 转 移 目标 地 址 和 转移 决策 都 可 以 在 流水 线 的 译 码 阶段 ， 也 
就 是 指令 执行 的 第 2 个 周期 确定 。 在 同一 周期 中 要 提取 的 指令 可 能 是 也 可 能 不 是 转移 指令 之 后 
要 执行 的 那 条 。 它 可 能 必须 被 丢弃 ， 在 这 种 情况 下 ， 正 确 的 指令 将 在 第 3 个 周期 提取 。 如 何 利 
用 转移 预测 来 获取 更 好 的 性 能 ? 

提高 性 能 的 关键 是 提高 在 第 2 个 周期 提取 指令 的 正确 率 。 这 只 有 当 和 转移 预测 在 第 1 个 周 
期 与 提取 转移 指令 同时 发 生 时 才 可 以 实现 。 为 了 做 到 这 一 点 ， 处 理 器 需要 保留 更 多 的 执行 历史 
信息 。 这 些 信息 通常 保存 在 一 个 被 称 为 转移 目标 缓冲 区 (branch target buffer ) 的 小 型 、 快 速 的 
存储 需 中 。 

转移 目标 缓冲 区 根据 指令 地 址 来 识别 转移 指令 。 随 着 每 条 转移 指令 的 执行 ， 处 理 需 在 组 
冲 区 中 记录 指令 的 地 址 和 转移 决策 的 结果 。 信 息 被 组 织 成 一 个 查找 表 的 形式 ， 其 中 每 个 表 项 
包括 : 

e 转移 指令 的 地 址 

e 转移 预测 算法 的 一 个 或 两 个 状态 位 

e 转移 目标 地 址 
有 了 这 些 信息 ， 处 理 器 就 能 够 识别 转移 指令 ， 并 根据 所 提取 指令 的 地 址 来 获得 相应 的 转移 预测 
状态 位 。 

每 次 处 理 器 提取 了 一 条 新 的 指令 ， 它 就 会 在 转移 目标 缓冲 区 查找 包含 相同 指令 地 址 的 表 
项 。 如 果 找 到 含有 那个 地 址 的 表 项 ， 这 意味 着 要 提取 的 指令 是 一 条 转移 指令 。 然 后 处 理 器 能 使 
用 状态 位 去 预测 是 否 可 能 发 生 转移 。 同 时 ， 目 标 地 址 也 得 到 了 。 这 些 信息 在 处 理 器 于 第 1 个 周 
期 提取 转移 指令 时 就 能 获得 。 在 第 2 个 周期 ， 处 理 器 使 用 该 转移 的 预测 结果 去 提取 下 一 条 指 
令 。 当 然 ， 它 还 必须 确定 实际 的 转移 决策 和 目标 地 址 以 判断 预测 值 是 否 正 确 。 如 果 正 确 ， 程序 
继续 执行 ， 没 有 时 间 代 价 。 否 则 ， 刚 已 提取 到 的 指令 会 被 丢弃 ， 并 在 第 3 个 周期 提取 正确 的 指 
令 。 转 移 目标 缓冲 区 的 主要 价值 在 于 转移 预测 所 需 的 状态 信息 和 转移 指令 的 目标 地 址 都 能 够 在 
提取 转移 指令 的 同时 获得 。 

大 型 程序 有 许多 转移 指令 。 一 个 有 足够 存储 空间 来 容纳 所 有 转移 指令 信息 的 转移 目标 组 
冲 区 将 是 很 大 的 ， 对 它 进行 快速 搜索 就 会 很 难 。 出 于 这 个 原因 ， 查 找 表 的 大 小 是 有 限 的 ， 只 包 
含 最 近 执 行 的 转移 指令 的 信息 。 当 其 他 的 转移 指令 执行 时 ， 表 中 的 表 项 被 替换 。 通 常情 况 下 ， 
这 个 表 包 含 大 约 1024 个 表 项 。 


6.7 资源 限制 


流水 线 使 得 指令 可 以 重 友 执行， 但 是 当 没 有 足够 的 硬件 资源 以 允许 所 有 的 动作 同时 进行 
时 ， 流 水 线 便 会 暂停 。 在 同一 时 钟 周期 中 ， 如 果 两 条 指令 需要 访问 相同 的 资源 ， 那 么 必须 暂停 
一 条 指令 以 允许 另 一 条 指令 使 用 资源 。 这 种 情况 可 以 通过 提供 额外 的 硬件 来 避免 。 

在 一 台 只 有 一 个 高 速 缓存 且 每 个 周期 只 能 访问 一 次 该 高 速 缓存 的 计算 机 中 会 发 生 这 种 停 
顿 。 如 果 流 水 线 的 取 指 和 访 存 阶段 都 连接 到 高 速 缓存 上 ， 那 么 不 可 能 同时 进行 两 个 阶段 的 活 
动 。 通 常情 况 下 ， 取 指 阶 段 在 每 个 周期 都 会 访问 高 速 缓存 。 然 而 ， 当 在 访 存 阶段 有 一 条 Load 
或 Store 指令 也 需要 访问 高 速 缓存 时 ， 这 个 取 指 阶段 的 活动 必须 被 暂停 一 个 周期 。 如 果 所 有 被 
执行 的 指令 中 有 25% 是 Load 或 Store 指令 ,那么 这 些 停顿 会 使 执行 时 间 增 加 25%。 对 指令 和 
数据 使 用 分 离 的 高 速 缓存 可 以 使 取 指 阶段 和 访 存 阶段 同时 进行 而 没有 停顿 。 
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6.8 性 能 评估 
对 于 非 流水 线 处 理 器 ， 拥 有 动态 指令 数 N 的 程序 其 执行 时 间 了 由 公式 
这 NxS 
R 


给 出 ， 其 中 5 是 提取 并 执行 一 条 指令 所 用 时 钟 周期 的 平均 数 ，R 是 时 钟 频率 ( 以 每 秒 周 期 数 为 
单位 )。 这 通常 被 称 为 基本 性 能 公式 ( basic performance equation )。 一 个 有 用 的 性 能 指标 是 指令 
吞吐 量 (instruction throughput )， 它 是 每 秒 钟 执行 的 指令 数量 。 对 于 非 流 水 线 执行 ， 吞 吐 量 P，， 
由 公式 


了 


Pu=$ 209 
给 出 。 第 5 章 介绍 的 处 理 器 使 用 $ 个 周期 来 执行 所 有 指令 。 因 此 ， 如 果 没 有 高 速 绥 存 失 效 ， 那 
么 5 就 等 于 5。 
流水 线 通 过 重生 执行 连续 的 指令 来 提高 性 能 ， 它 增加 了 指令 吞吐 量 ， 尽 管 单条 指令 的 执 
行 周期 数 仍然 相同 。 对 于 本 章 描述 的 5 段 流 水 线 ， 每 条 指令 在 5 个 周期 内 执行 ， 但 是 理想 情况 
下 每 个 周期 都 有 一 条 新 的 指令 进入 流水 线 。 因 此 ， 当 不 存在 停顿 时 ，5 等 于 1， 使 用 流水 线 技 
术 的 理想 吞吐 量 是 














P=R 

5 段 流水 线 可 使 吞吐 量 提 高 5 倍 。 通 常 ，n 段 流水 线 有 可 能 将 吞吐 量 提高 n 倍 。 因 此 ， 似 
平 n 值 越 高 ， 得 到 的 性 能 就 越 强 。 这 会 引起 两 个 问题 : 

e@ 指令 吞吐 量 的 潜在 提高 实际 上 能 真正 实现 多 少 ? 

e n 值 最 好 为 多 少 ? 
只 要 流水 线 出 现 暂 停 或 者 指令 被 丢弃 ， 指 令 吞 吐 量 就 会 降低 到 理想 值 以 下 。 因 此 ， 流 水 线 的 性 
能 大 大 受到 诸如 因 指 令 间 的 数据 依赖 性 而 产生 的 停顿 和 因 转 移 而 产生 的 时 间 代 价 等 因素 的 影 
响 。 高 速 缓存 失效 会 进一步 增加 执行 时 间 。 我 们 先 讨论 这 些 问 题 ， 然 后 再 讨论 应 该 采用 多 少 段 
流水 线 的 问题 。 


6.8.1 停顿 和 时 间 代 价 的 影响 

前 几 节 已 经 定性 地 研究 了 停顿 和 时 间 开 销 的 影响 。 现 在 我 们 将 定量 地 考虑 一 下 这 些 影响 。 

5 段 流 水 线 包含 取 指 和 访 存 阶段 的 存储 器 访问 操作 和 计算 阶段 的 ALU 操作 。 具 有 最 长 延 
迟 的 操作 决定 了 周期 时 间 和 时 钟 速率 R。 对 于 具有 片上 高 速 缓存 的 处 理 器 来 说 ， 当 所 需 的 指 
令 或 数据 能 在 高 速 缓存 中 找到 时 ， 存 储 器 访问 操作 的 延迟 很 小 。 所 以 通过 ALU 的 延迟 可 能 是 
关键 的 参数 。 如 果 这 个 延迟 是 2 ns， 那 么 R=500 MHz， 理 想 的 流水 线 指令 吞吐 量 是 P, = 500 
MIPS ( 每 秒 百 万 条 指令 )。 

考虑 一 个 具有 6.4.1 节 中 所 述 的 操作 数 转发 功能 的 处 理 器 。 这 意味 着 除了 Load 指令 之 外 ， 
没有 因数 据 依 赖 性 而 产生 的 时 间 代 价 。 为 了 评估 与 高 速 缓存 失效 无 关 的 停顿 的 影响 ， 我 们 可 以 
考虑 一 下 在 Load 指令 后 面 紧 跟 着 一 条 使 用 存储 器 访问 结果 的 指令 的 频率 。6.5 节 解 释 了 在 这 样 
的 情况 下 ， 一 周期 的 停顿 是 必需 的 。 虽 然 理 想 的 流水 线 执行 中 $=1, 但 由 于 这 种 Load 指令 而 
产生 的 停顿 会 将 5 增加 dm。 例如 ， 假设 Load 指令 占 动态 指令 数 的 25%， 并 假设 这 些 Load 指 
令 中 有 40% 后 面 跟着 一 条 依赖 的 指令 。 在 这 样 的 情况 下 ， 需 要 一 个 一 周期 的 停顿 。 因 此 ， 将 
理想 情况 S=1 增加 了 

Guau=0.25 x 0.40 x 1=0.10 
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也 就 是 说 ， 执 行 时 间 了 被 增加 了 10%， 吞 吐 量 被 减少 到 
RR 
人 =0.91R 


编译 器 可 以 通过 减少 Load 指令 后 面 紧 跟 一 条 相关 指令 的 次 数 来 提高 性 能 。 每 当 编译 器 可 以 将 
附近 的 一 条 指令 安全 地 移 到 Load 指令 和 依赖 的 指令 之 间 的 位 置 上 时 就 能 消除 一 个 停顿 。 

现在 ， 考 虑 一 下 程序 执行 期 间 由 于 错误 预测 转移 而 产生 的 时 间 代 价 。 当 转移 决策 和 转移 
目标 地 址 都 在 流水 线 的 译 码 阶段 确定 时 ， 转 移 代 价 是 一 个 周期 。 假 设 转移 指令 占 程 序 动态 指 
令 数 的 20%， 并 且 转 移 指令 的 平均 预测 准确 率 是 90%。 换 名 话说， 所 有 执行 的 转移 指令 中 有 
10% 会 因为 预测 错误 而 产生 一 个 周期 的 时 间 代价 。 由 于 转移 代价 而 导致 每 条 指令 的 平均 周期 数 
增加 了 

Obranch penatty =0.20 x 0.10 x 1=0.02 

较 高 的 预测 准确 度 在 限制 这 个 代价 对 性 能 的 负面 影响 方面 是 有 利 的 。 

跟 Load 指令 有 关 的 停顿 和 转移 预测 错误 的 代价 是 相互 独立 的 。 因 此 ， 它 们 对 性 能 的 影响 
是 相 加 的 。6s 和 omne py 的 和 决定 了 周期 数 $ 的 增加 、 执 行 时 间 7 的 增加 以 及 吞吐 量 的 P， 
减少 。 

高 速 缓存 失效 对 性 能 的 影响 可 以 通过 考虑 其 发 生 的 频率 来 进行 评估 。 每 次 发 生 高 速 缓存 
失效 时 ， 访 问 速度 较 慢 的 主 存储 器 的 时 间 是 暂停 流水 线 p 个 周期 的 代价 。 所 有 被 提取 的 指令 
中 有 一 小 部 分 mi 会 引起 高 速 缓存 失效 。 所 有 指令 中 有 一 小 部 分 4 是 Load 或 Store 指令 ， 这 些 
指令 中 有 一 部 分 ms 会 引起 高 速 缓存 失效 。 由 于 高 速 缓存 失效 而 导致 理想 情况 S=1 增加 了 

Omiss= (mitd x ma) x pm 
假设 所 有 被 提取 指令 中 有 5% 会 引起 高 速 缓 存 失效 ， 而 所 有 执行 指令 中 有 30% 是 Load 或 Store 
指令 ， 并 且 这 些 指令 中 10% 的 数据 操作 数 访 问 会 引起 高 速 缓存 失效 。 假 设 由 于 高 速 缓存 失效 
而 访问 主 存储 器 的 时 间 代 价 是 10 个 周期 。 在 这 种 情况 下 ， 由 于 高 速 缓存 失效 而 导致 理想 情况 
S=1 的 增加 由 
Omiss= (0.05+0.30+0.10) x 10=0.8 

给 出 。 
与 数据 依赖 性 的 6w 和 转移 预测 错误 的 Branen reay 相 比 ， 在 这 个 例子 中 ， 由 于 高 速 缓存 失 
效 而 访问 慢 速 的 主 存储 器 的 影响 更 为 显著 。 当 将 所 有 的 因素 结合 起 来 时 ，5 会 从 理想 值 1 增加 
到 1 + Owan+ Obrandlipadly + Oiiso 高 速 缓存 失效 的 影响 往往 是 其 中 占 主导 地 位 的 一 个 因素 。 


6.8.2 ”流水线 的 段 数 


n 段 流 水 线 可 以 使 指令 吞吐 量 提高 n 倍 的 事实 促使 我 们 使 用 大 量 的 流水 线段 。 然 而 ， 随 着 
流水 线段 数 的 增加 ， 会 有 更 多 的 指令 并 发 地 执行 。 因 此 ， 指 令 间 会 存在 更 多 的 可 能 引起 流水 线 
停顿 的 潜在 依赖 性 。 此 外 ， 如 果 较 长 的 流水 线 将 转移 决策 移 到 后 面 的 阶段 ， 那 么 转移 代价 可 能 
大 于 一 个 周期 。 由 于 这 些 原 因 , 值 的 增加 所 带 来 的 吞吐 量 增益 开始 减 小 ， 更 多 段 的 流水 线 的 
成 本 可 能 就 不 再 合理 了 。 

另 一 个 重要 因素 是 处 理 器 执行 的 基本 操作 中 的 固有 延迟 ， 其 中 最 重要 的 是 ALU 延迟 。 在 
许多 处 理 器 中 ， 处 理 器 将 完成 一 项 ALU 操作 的 时 间 当 作 一 个 时 钟 周期 的 大 小 。 其 他 的 操作 ， 
包括 访问 高 速 缓存 的 操作 ， 通 常 分 为 几 步 ， 其 中 每 一 步 需 要 的 时 间 大 约 与 完成 一 个 ALU 操作 
的 时 间 相 同 。 如 果 使 用 流水 线 ALU， 有 可 能 进一步 减少 时 钟 周 期 时 间 。 最 近 的 一 些 处 理 器 实 
现 中 使 用 20 或 更 多 的 流水 线段 来 大 大 减少 周期 时 间 。 利 用 现代 技术 实现 这 种 长 流水 线 可 以 达 
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到 几 GHz 的 时 钟 速率 。 


6.9 超标 量 操作 

流水 线 处 理 器 的 最 大 吞吐 量 是 每 个 时 钟 周期 完成 一 条 指令 。 一 种 更 先进 的 方法 是 使 处 理 
器 配备 有 多 个 执行 部 件 ， 每 个 部 件 都 可 以 被 流水 ， 来 提高 处 理 器 并 行 处 理 多 条 指令 的 能 力 。 有 
了 这 种 方案 ， 多 条 指令 可 以 在 同一 个 时 钟 周 期 但 在 不 同 的 执行 部 件 上 开始 执行 ， 这 种 处 理 器 被 
称 为 使 用 了 多 发 操作 (multiple-issue )。 这 种 处 理 器 的 指令 执行 吞吐 量 可 以 达到 每 个 周期 执行 
多 条 指令 ， 它 们 通常 被 称 为 超标 量 ( superscalar ) 处 理 器 。 许 多 现代 的 高 性 能 处 理 器 就 是 采用 
这 种 方式 。 

为 了 实现 多 发 操作 的 执行 ， 超 标量 处 理 器 有 一 个 很 复杂 的 取 指 部 件 〈fetch unit )， 在 需要 
一 条 指令 之 前 ， 取 指 部 件 每 个 周期 提取 两 条 或 两 条 以 上 的 指令 ， 并 将 它们 放 到 指令 队列 中 。 一 
个 称 为 调度 部 件 ( dispatch unit ) 的 独立 部 件 ， 从 队列 的 头 部 取出 两 条 或 两 条 以 上 的 指令 ， 对 它 
们 进行 译 码 ， 并 将 它们 发 送 到 适当 的 执行 部 件 中 。 在 流水 线 的 末端 ， 另 一 个 部 件 负责 将 结果 写 
入 到 寄存 器 文件 中 。 图 6-13 给 出 了 一 个 具有 这 种 结构 的 超标 量 处 理 器 。 它 包含 两 个 执行 部 件 ， 
一 个 用 于 算术 指令 ， 另 一 个 用 于 Load 和 Store 指令 。 算 术 运 算 一 般 只 需要 一 个 周期 ， 因 此 第 
一 个 执行 部 件 比较 简单 。 因 为 Load 和 Store 指令 在 每 次 存储 器 访问 之 前 需要 为 变 址 方式 计算 
地 址 ， 所 以 Load/Store 部 件 有 一 个 2 段 的 流水 线 。 


Ee 


指令 队列 











调度 部 件 


| 算术 部 件 | 
Load/Store 
图 6-13 含有 两 个 执行 部 件 的 超标 量 处 理 器 


图 6-13 的 结构 为 寄存 器 文件 提出 了 一 些 重要 的 启示 。 当 一 条 算术 指令 和 一 条 Load 或 
Store 指令 在 同一 个 周期 中 被 发 送 给 两 个 执行 部 件 时 ， 它们 必须 从 寄存 器 文件 中 获得 它们 的 操 
作 数 。 现 在 寄存 器 文件 必须 有 4 个 输出 端口 而 不 是 简单 流水 线 中 所 需要 的 2 个 输出 端口 。 同 
样 ， 当 一 条 算术 指令 和 一 条 Load 指令 在 同一 个 周期 中 完成 时 ， 它 们 必须 将 其 结果 写 人 寄存 器 
文件 中 。 因 此 ， 寄 存 器 文件 现在 必须 有 2 个 输入 端口 而 不 是 简单 流水 线 中 的 一 个 输入 端口 。 还 
有 一 个 潜在 的 问题 是 ， 两 条 指令 可 能 同时 竞争 一 个 寄存 器 作为 写 人 结果 的 目标 寄存 器 。 通 过 指 
令 调 度 ， 防 止 两 条 指令 同时 写 同 一 个 寄存 器 有 可 能 避免 这 个 问题 。 和 否则 ， 必 须 暂 停 一 条 指令 ， 
以 确保 按 程 序 的 原 指 令 序 列 顺序 将 结果 写 人 目标 寄存 器 。 

为 了 说 明 图 6-13 中 处 理 器 的 超标 量 执行 ， 考 虑 下 面 的 指令 序列 : 

Add R2, R3, #100 
Load R5, 16(R6) 
Subtract R7, R8, R9 
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Store R10, 24(R11) 

图 6-14 显示 了 这 些 指令 的 执行 方式 。 取 指 部 件 每 个 周期 提取 两 条 指令 。 在 下 一 个 周期 中 

这 两 条 指令 被 译 码 ， 并 读 取 它们 的 源 寄存 器 。 然 后 ， 指 令 被 发 送 给 算术 部 件 和 Load/Store 部 
件 。 算 术 运 算 每 个 周期 都 可 以 开始 。Load 或 Store 指令 也 可 以 每 个 周期 都 开始 ， 因 为 Load/ 
Store 部 件 中 的 2 段 流 水 线 将 Load 或 Store 指令 的 地 址 计算 与 前 面 一 条 Load 或 Store 指令 的 存 
储 器 访问 重 释 起 来 。 当 指令 分 别 在 算术 部 件 和 Load/Store 部 件 中 完成 执行 时 ， 寄 存 器 文件 允许 
在 同一 个 周期 中 写 人 两 个 结果 ， 因 为 它们 的 目标 寄存 器 不 同 。 
时 钟 周期 1 2 3 5 6 ee 


， 
Adad Ra Ra ao [ETDT clw| 
Subract RT, RE ia 


图 6-14 图 6-13 所 示 处 理 器 中 的 指令 流 例子 


6.9.1 转移 和 数据 依赖 性 

当 不 存在 任何 转移 指令 以 及 指令 间 不 存在 任何 数据 依赖 性 时 ， 可 以 将 能 同时 发 送 给 不 同 
执行 部 件 的 指令 进行 交错 来 使 吞吐 量 最 大 化 。 然 而 ， 程 序 中 可 能 会 包含 转移 指令 和 指令 间 的 数 
据 依赖 性 ， 超 标量 处 理 器 必须 确保 指令 能 按 正确 的 顺序 执行 。 此 外 ， 由 于 高 速 缓存 失效 引起 的 
存储 器 延迟 有 时 可 能 会 暂停 指令 的 提取 和 调度 。 所 以 ， 实 际 吞 吐 量 通常 低 于 理论 的 最 大 值 。 转 
移 指令 和 数据 依赖 性 所 带 来 的 挑战 可 以 用 额外 的 硬件 来 解决 。 我 们 首先 考虑 转移 指令 ， 然 后 再 
考虑 由 数据 依赖 性 所 产生 的 问题 。 

取 指 部 件 在 决定 将 哪些 指令 放 入 调度 队列 中 时 处 理 转 移 指 令 。 它 必须 确定 转移 决策 和 每 
条 转移 指令 的 目标 。 转 移 决 策 可 能 依赖 于 一 条 较 早 的 还 在 排队 的 指令 或 者 刚刚 被 调度 的 指令 的 
结果 。 将 取 指 部 件 暂 停 直 到 结果 可 用 会 显著 降低 吞吐 量 ， 因 此 这 不 是 一 种 可 取 的 方法 。 因 而 ， 
最 好 是 采用 转移 预测 的 方法 。 由 于 我 们 的 目标 是 实现 高 吞吐 量 ， 所 以 还 可 以 将 转移 预测 与 一 种 
称 为 推测 执行 ( speculative execution ) 的 技术 结合 起 来 。 在 这 种 技术 中 ， 对 基于 未 经 证 实 的 预 
测 选择 的 后 续 指 令 进 行 提取 、 调 度 ， 甚 至 执行 ， 但 是 它们 被 标记 为 推测 的 ， 以 便于 当 预 测 不 正 
确 时 可 以 将 这 些 指令 及 其 结果 丢弃 。 这 个 技术 需要 额外 的 硬件 来 维护 有 关 推 测 执行 指令 的 信 
息 ， 确 保 寄存 器 或 存储 单元 在 预测 的 有 效 性 被 证 实 之 前 不 能 被 修改 。 同 时 还 需要 额外 的 硬件 来 
确保 万 一 预测 错误 ， 正 确 的 指令 也 能 够 被 提取 和 调度 。 

指令 间 的 数据 依赖 性 对 指令 序列 施加 了 排序 约束 。 一 种 简单 的 方法 是 按 顺 序 将 相依 赖 的 
指令 发 送 给 同一 执行 部 件 ， 在 该 部 件 中 维持 这 些 指 令 的 顺序 。 然 而 ， 有 些 时 候 相 依赖 的 指令 可 
能 被 发 送 到 不 同 的 执行 部 件 。 例 如 ， 一 条 被 发 送 到 网 6-13 中 Load/Store 部 件 的 Load 指令 ， 其 
结果 可 能 被 一 条 被 发 送 到 算术 部 件 的 Add 指令 所 需要 。 因 为 这 些 部 件 独 立 操作 ， 并 且 可 能 已 
经 将 其 他 的 指令 发 送 到 这 些 部 件 中 了 ， 所 以 没有 办 法 保证 Add 指令 需要 的 结果 是 由 Load 指令 
产生 的 。 这 就 需要 一 种 机 制 来 确保 一 条 依赖 指令 会 等 待 它 的 操作 数 变 得 可 用 。 当 一 条 指令 被 发 
送 给 一 个 执行 部 件 时 ， 它 被 缓存 起 来 ， 直 到 所 有 必需 的 来 自 其 他 指令 的 结果 都 产生 为 止 。 这 样 
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的 缓冲 区 被 称 为 保留 站 (reservation station )， 它 们 用 于 保存 与 每 条 被 调度 指令 有 关 的 信息 和 操 
作 数 。 每 个 执行 部 件 的 结果 被 广播 到 所 有 的 保留 站 ， 其 中 每 个 结果 都 被 打上 了 寄存 器 标识 符 的 
标签 。 这 使 得 保留 站 可 以 识别 一 条 被 缓冲 指令 所 依赖 的 结果 。 当 有 配对 的 标签 时 ， 硬 件 将 结果 
拷贝 到 包含 该 指令 的 保留 站 中 。 只 有 当 被 缓冲 的 指令 得 到 了 它 所 有 的 操作 数 时 ， 控 制 电路 才 开 
始 执行 它 。 

在 使 用 多 发 操作 的 超标 量 处 理 器 中 ， 停 顿 所 带 来 的 负面 影响 比 在 单 发 操作 的 流水 线 处 理 
器 中 更 加 明显 。 编 译 器 能 够 通过 合理 的 选择 和 指令 排序 来 避免 许多 停顿 。 例 如 ， 对 于 图 6-13 
中 的 处 理 器 ， 编 译 器 应 该 尽量 将 算术 指令 和 存储 器 指令 交错 开 来 。 这 使 得 调度 部 件 能 够 保持 两 
个 部 件 在 大 部 分 时 间 都 处 于 工作 状态 。 


6.9.2 无 序 执行 

图 6-14 中 的 指令 按照 它们 在 程序 中 出 现 的 顺序 进行 调度 。 然 而 ， 指 令 的 执行 可 能 是 无 序 
完成 的 。 例 如 ，Subtract 指令 写 人 寄存 器 R7 的 操作 与 之 前 的 Load 指令 写 人 寄存 器 R5 的 操作 
在 同一 个 周期 中 。 如 果 Load 指令 的 存储 器 访问 需要 多 个 周期 完成 ， 那 么 Subtract 指令 的 执行 
将 在 Load 指令 之 前 完成 。 这 种 情况 会 带 来 问题 吗 ? 

我 们 已 经 讨论 过 指令 之 间 的 依赖 性 所 产生 的 问题 。 例 如 ， 如 果 指 令 六 依赖 指令 了 的 结 
果 ， 但 是 当 需 要 该 结果 的 时 候 如 果 它 还 无 法 得 到 ， 那 么 IJ 的 执行 就 被 延迟 。 只 要 这 种 依赖 性 
能 够 被 正确 处 理 ， 就 不 必 延 迟 无 关 指令 的 执行 。 如 果 一 对 指令 间 没 有 依赖 性 ， 则 指令 完成 的 顺 
序 就 无 关 紧 要 。 

然而 ， 在 考虑 到 指令 可 能 会 引起 异常 时 就 又 出 现 了 新 的 困难 。 例 如 ， 图 6-14 中 的 Load 指 
令 可 能 会 试图 进行 一 次 非法 的 未 对 齐 的 存储 器 访问 来 获取 其 数据 操作 数 。 当 识别 到 这 个 非法 操 
作 的 时 候 ，Load 指令 之 后 的 Subtract 指令 可 能 已 经 修改 了 它 的 目标 寄存 器 。 现 在 程序 的 执行 
就 会 出 现 不 一 致 的 状态 。 在 原 序 列 中 发 现 了 导致 异常 的 指令 ， 但 是 该 序列 中 的 一 条 后 续 指 令 已 
经 执行 完成 。 如 果 人 允许 这 种 状况 的 发 生 ， 就 说 该 处 理 器 有 不 精确 异常 ( imprecise exception )。 

另 一 种 称 为 精确 异常 ( precise exception ) 的 方法 需要 额外 的 硬件 。 为 了 保证 异常 发 生 时 状 
态 的 一 致 性 ， 指 令 的 执行 结果 必须 严格 按 程 序 顺 序 写 人 到 目标 位 置 。 这 意味 着 必须 延迟 图 6-14 
中 Subtract 指令 写 人 寄存 器 R7 的 操作 ， 直 到 Load 指令 的 寄存 器 R5 被 更 新 之 后 Subtract 指令 
才 写 人 寄存 器 R7。 这 样 ， 图 6-13 中 的 算术 部 件 必须 保留 Subtract 指令 的 结果 ， 或 者 将 结果 组 
存在 一 个 临时 寄存 器 中 ， 直 到 前 面 的 指令 已 经 写 人 了 它们 的 结果 。 如 果 在 指令 执行 期 间 发 生 异 
常 ， 那 么 所 有 后 续 指令 及 其 被 缓存 的 结果 都 将 被 丢弃 。 

在 外 部 中 断 的 情况 下 很 容易 提供 精确 异常 。 当 接收 到 一 个 外 部 中 断 时 ， 调 度 部 件 停止 从 
指令 队列 中 读 取 新 的 指令 ， 丢 弃 队 列 中 剩余 的 指令 。 所 有 未 执行 完 的 指令 继续 执行 。 此 时 ， 处 
理 器 和 其 所 有 的 寄存 器 都 处 于 一 致 的 状态 ， 可 以 开始 对 中 断 进 行 处 理 了 。 


6.9.3 执行 完成 


为 了 提高 性 能 ， 应 该 允许 执行 部 件 执行 其 操作 数 已 在 其 保留 站 中 就 绪 的 任何 指令 。 这 可 
能 导致 指令 的 无 序 执行 。 然 而 ， 指 令 必须 按 程序 顺序 完成 以 允许 精确 异常 。 这 两 个 看 上 去 冲突 
的 要 求 可 以 通过 使 用 临时 寄存 器 解决 。 允 许 指令 无 序 执行 但 是 结果 要 写 到 临时 寄存 器 中 ， 随 
后 临时 寄存 器 的 内 容 被 按 正 确 的 程序 顺序 传送 到 永久 寄存 器 中 。 最 后 这 一 步 通 常 被 称 为 提交 
(commitment ) 步 ， 因 为 从 这 点 之 后 指令 的 影响 不 能 再 被 恢复 。 如 果 一 条 指令 导致 异常 ， 由 于 
任何 已 经 执行 的 后 续 指 令 的 结果 此 时 仍然 保存 在 临时 寄存 器 中 ， 所 以 可 以 被 安全 地 丢弃 。 通 
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常 ， 需 要 正常 写 人 存储 器 中 的 结果 也 会 被 临时 缓冲 ， 并 且 它 们 也 可 以 被 安全 地 丢弃 。 

为 保存 指令 结果 而 分 配 的 临时 寄存 器 承担 永久 寄存 器 的 作用 ， 其 中 缓存 着 永久 寄存 器 应 
该 保存 的 数据 。 在 此 期 间 ， 临 时 寄存 器 的 内 容 被 转发 给 任何 指向 原来 的 永久 寄存 器 的 后 续 指 
令 。 这 项 技术 被 称 为 寄存 器 重 命名 ( register renaming )。 临 时 寄存 器 可 能 和 永久 寄存 器 一 样 多 ， 
也 可 能 比 永久 寄存 器 少 ， 它 们 可 以 根据 需要 分 配 ， 与 不 同 的 永久 寄存 器 联系 起 来 。 

当 人 允许 无 序 执行 时 ， 需 要 一 个 专门 的 控制 部 件 来 保证 指令 按 正确 的 顺序 提交 。 这 个 部 件 
被 称 为 提交 部 件 (commitment unit )。 它 使 用 一 个 称 为 重 排序 缓冲 器 (reorder buffer ) 的 单独 队 
列 来 决定 下 一 次 应 该 提交 哪 条 ( 哪些 ) 指令 。 随 着 指令 不 断 地 被 调度 执行 ， 指 令 严 格 地 按照 程 
序 顺序 进入 队列 。 当 一 条 指令 到 达 队 首 并 且 该 指令 的 执行 已 经 完成 时 ， 相 应 的 结果 从 临时 寄存 
器 传送 到 永久 寄存 器 中 ， 指 令 从 队列 中 移 除 。 释 放 所 有 分 配给 该 指令 的 资源 ， 包 括 临时 寄存 
器 。 这 时 就 说 该 指令 已 经 被 释放 (retire ) 了 - 因为 只 有 当 指 令 位 于 队 首 时 才 会 被 释放 ， 在 它 
之 前 调度 的 所 有 指令 也 一 定 都 被 释放 了 。 因 此 ， 指 令 可 以 按照 无 序 方 式 结束 执行 ， 但 必须 按照 
程序 的 顺序 来 释放 。 


6.9.4 调度 操作 

我 们 现在 讨论 调度 操作 。 当 作出 调度 决策 时 ， 调 度 部 件 必须 确保 已 经 具备 了 指令 执行 所 
需要 的 所 有 资源 。 例 如 ， 由 于 指令 的 执行 结果 可 能 需要 写 到 临时 寄存 器 中 ， 所 以 应 该 有 一 个 可 
用 的 寄存 器 ， 并 且 保 留 出 来 用 作 那 条 指令 进行 调度 操作 的 一 部 分 。 另 外 ， 在 相应 执行 部 件 的 保 
留 站 中 必须 有 可 用 的 空间 。 最 后 ， 在 重 排序 缓冲 器 中 也 必须 为 该 指令 留 出 以 后 提交 结果 的 位 
置 。 当 分 配 完 所 需要 的 所 有 资源 时 ， 便 可 以 调度 这 条 指令 了 -。 

指令 可 以 按照 无 序 方式 进行 调度 吗 ? 例如 ， 考虑 图 6-14 中 的 Load 指令 ， 先 前 被 调度 指令 
的 高 速 缓存 失效 会 使 得 Load/Store 部 件 的 保留 站 中 没有 空间 ， 从 而 导致 Load 指令 的 调度 被 延 
迟 。 那 么 此 时 可 以 调度 Subtract 指令 吗 ? 理论 上 这 是 可 以 的 ， 只 要 为 Load 指令 保留 它 需 要 的 
所 有 资源 ， 包 括 在 重 排 序 缓冲 器 中 的 位 置 。 这 对 确保 所 有 指令 最 终 按 正 确 的 顺序 释放 并 且 不 会 
发 生死 锁 来 说 是 非常 重要 的 。 

死 锁 ( deadlock ) 是 当 两 个 部 件 A 和 B 使 用 同一 共享 资源 时 出 现 的 一 种 状态 。 假 设 B 部 
件 要 等 到 A 部 件 完 成 后 才能 完成 它 的 操作 。 同 时 ，A 部 件 所 需要 的 资源 已 经 分 配给 了 B 部 件 。 
如 果 这 种 情况 发 生 ， 那 么 两 个 部 件 都 不 能 完成 其 操作 。A 部 件 等 待 它 所 需要 的 资源 ， 而 该 资源 
正 被 B 部 件 占 有 。 同 时 ，B 部 件 在 完成 其 操作 并 释放 该 资源 之 前 要 等 待 A 部 件 完成 。 

当 按 无 序 方式 调度 指令 时 ， 考 虑 只 有 一 个 临时 寄存 器 的 超标 量 处 理 器 作为 死 锁 的 例子 。 
当 图 6-14 中 的 Subtract 指令 在 Load 指令 之 前 被 调度 时 ， 将 临时 寄存 器 保留 给 Subtract 指令 使 
用 。Load 指令 由 于 正在 等 待 同一 个 临时 寄存 器 而 不 能 被 调度 ， 而 该 临时 寄存 器 直到 Subtract 指 
令 释 放 后 才 会 空 六 。 又 由 于 Subtract 指令 不 能 在 Load 指令 之 前 释放 ， 所 以 产生 死 锁 。 

为 了 预防 死 锁 ， 调 度 部 件 必须 考虑 许多 因素 。 因 此 ,无 序 地 发 出 指令 可 能 会 大 大 增加 调 
度 部 件 的 复杂 度 。 这 也 意味 着 可 能 需要 更 多 的 时 间作 出 调度 决策 。 有 序 地 调度 指令 可 以 避免 这 
种 复杂 性 。 在 这 种 情况 下 ， 指 令 被 调度 的 时 刻 和 被 释放 的 时 刻 都 是 按照 它们 在 程序 中 的 顺序 进 
行 的 。 在 这 两 个 时 刻 之 间 ， 只 要 没有 指令 间 的 内 部 依赖 性 的 影响 ， 多 个 执行 部 件 中 几 条 指令 的 
执行 都 可 以 无 序 地 进行 。 

超标 量 处 理 器 的 最 后 一 个 问题 是 关于 执行 部 件 的 数量 。 图 6-13 中 的 处 理 器 有 一 个 算术 部 
件 和 一 个 Load/Store 部 件 。 为 了 获得 更 高 的 性 能 ， 现 代 的 超标 量 处 理 器 通常 都 有 两 个 用 于 整数 
操作 的 算术 部 件 ， 以 及 一 个 独立 的 用 于 浮 点 操作 的 算术 部 件 。 浮 点 部 件 有 它 自 己 的 寄存 器 文 
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件 。 许 多 处 理 器 还 包含 一 个 用 于 整数 或 浮 点 运算 的 向 量 部 件 ， 它 通常 可 以 并 行 执 行 2 到 8 个 操 
作 。 这 样 的 部 件 也 可 能 有 其 专用 的 寄存 器 文件 。 一 个 Load/Store 部 件 通常 支持 整数 、 浮 点 或 向 
量 部 件 的 所 有 存储 器 访问 。 为 了 使 许多 执行 部 件 保 持 忙 碌 ， 现 代 处 理 器 可 以 同时 提取 4 条 或 更 
多 的 指令 放 到 指令 队列 的 尾部 ， 同 样 ， 可 以 从 指令 队列 的 头 部 调度 4 条 或 更 多 的 指令 发 送 给 执 
行 部 件 。 


6.10 ”CISC 处 理 器 中 的 流水 线 
RISC 处 理 器 的 指令 集 使 得 流水 线 相对 容易 实现 。 所 有 的 指令 都 是 一 个 字 的 长 度 ， 操 作 数 
信息 通常 位 于 不 同 指令 字 中 相同 的 位 置 。 没 有 指令 需要 多 个 存储 器 操作 数 。 只 有 Load 和 Store 
指令 会 访问 存储 器 操作 数 ， 通 常 只 使 用 变 址 寻 址 方式 。 所 有 其 他 的 指令 都 对 寄存 器 操作 数 进行 
操作 。 本 章 所 描述 的 5 段 流水 线 就 是 迎合 RISC 风格 指令 的 这 些 特 征 设计 的 。 
CISC 处 理 器 中 ， 由 于 指令 的 长 度 可 变 、 有 多 个 存储 器 操作 数 和 复杂 的 寻 址 方式 ， 以 及 条 
件 码 的 使 用 ， 使 得 在 CISC 处 理 器 中 实现 流水 线 出 现 困难 。 占 多 个 字 的 指令 可 能 需要 多 个 周期 
来 提取 。 此 外 ， 指 令 长 度 和 格式 的 可 变 使 得 译 码 和 操作 数 访问 跟 超 标量 处 理 器 中 调度 队列 的 管 
理 一 样 复杂 。 
执行 指令 时 ， 更 复杂 的 寻 址 方式 ( 如 自动 增 量 方式 或 自动 减 量 方式 ) 会 产生 副作用 ( side 
effect )。 当 除了 目标 操作 数 单元 之 外 的 另 一 个 单元 也 受到 影响 时 ， 就 会 发 生 副作用 。 例 如 ， 
指令 
Move RS, (R8)+ 
有 副作用 。 不 仅 目标 寄存 器 R5 受 影响 ， 源 寄存 器 R8 也 受 自 增 操作 的 影响 。 如 果 后 面 的 指令 
依赖 于 寄存 器 R8 中 的 值 ， 这 种 依赖 性 必须 像 对 待 涉及 目标 寄存 器 R5 的 依赖 性 一 样 用 额外 的 
硬件 来 处 理 。 它 可 能 需要 暂停 流水 线 或 者 转发 新 的 值 。 在 超标 量 处 理 器 中 ， 这 种 依赖 性 需要 使 
用 6.9.3 节 中 讨论 的 临时 寄存 器 和 寄存 器 重 命 名 来 处 理 。 
条 件 码 也 会 产生 副作用 。 例 如 ， 在 下 列 的 指令 序列 中 
Compare R7, R8 
Branch>0 TARGET 
Compare 指令 的 结果 对 条 件 码 标志 的 影响 是 一 个 副作用 ， 而 Branch 指令 隐 含 地 依赖 于 这 个 副 
作用 。 条 件 码 寄存 器 可 以 相对 容易 地 包含 在 如 图 6-2 所 示 的 简单 流水 线 中 ， 因 为 在 任何 周期 中 
只 执行 一 个 ALU 操作 。 然 而 ， 在 含有 多 个 执行 部 件 的 超标 量 处 理 器 中 ， 许 多 指令 可 能 会 处 于 
执行 的 不 同 阶段 ， 每 个 周期 可 能 会 执行 两 个 或 两 个 以 上 的 ALU 操作 。 与 条 件 码 有 关 的 副作用 
所 产生 的 依赖 性 需要 使 用 额外 的 临时 寄存 器 和 寄存 器 重 命名 来 处 理 。 
最 后 ， 考 虑 下 列 CISC 风格 的 指令 序列 : 
Move (R2), (R3) 
Move (R4), RS 
第 一 条 Move 指令 需要 对 存储 器 进行 两 次 操作 数 访问 ， 而 第 二 条 Move 指令 只 需要 一 次 。 在 如 
图 6-2 所 示 的 流水 线 中 执行 这 些 指 令 需 要 额外 的 硬件 来 暂停 第 二 条 Move 指令 ， 以 便于 第 一 条 
Move 指令 能 完成 它 对 存储 器 的 两 次 操作 数 访问 。 在 如 图 6-13 所 示 的 超标 量 处 理 器 中 ，Load/ 
Store 部 件 也 同样 必须 暂停 它 的 内 部 流水 线 。 
CISC 风格 的 指令 使 流水 线 变 得 复杂 。 这 是 开发 RISC 方法 的 主要 原因 之 一 。 尽 管 如 此 ， 
在 流水 线 开始 广泛 使 用 前 就 引入 的 CISC 风格 指令 集 也 已 经 有 为 其 实现 了 流水 线 的 处 理 器 。 附 
录 C 和 附录 EE 中 讨论 了 基于 ColdFire 和 Intel 指令 集 的 处 理 器 的 例子 。ColdFire 处 理 器 主要 用 
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于 嵌入 式 应 用 ， 而 Intel 处 理 器 提供 通用 的 需求 。 因 此 ，ColdFire 处 理 器 中 使 用 流水 线 的 程度 低 
于 Intel 处 理 器 。 


6.10.1 ColdFire 处 理 器 中 的 流水 线 

V1 和 V2 版 本 的 ColdFire 处 理 器 实现 中 有 两 个 流水 线 ， 它 们 之 间 由 一 个 先进 先 出 〈FIFO ) 
缓冲 区 相连 。2 段 的 指令 提取 流水 线 将 指令 预 取 到 缓冲 区 中 ， 然 后 缓冲 区 再 向 执行 指令 的 2 段 
流水 线 提供 指令 。 只 包含 寄存 器 操作 或 者 寄存 器 -存储 器 操作 的 指令 通过 这 两 个 执行 阶段 一 
次 。 包 含 存 储 器 -寄存 器 操作 或 者 存储 器 -存储 器 操作 的 指令 必须 通过 这 两 个 执行 阶段 两 次 。 

更 高 版 本 的 ColdFire 处 理 器 实现 中 在 两 个 流水 线 间 使 用 类 似 的 缓冲 区 结构 ， 但 为 了 更 高 
的 性 能 ， 这 些 版 本 中 包含 了 各 种 增强 的 功能 。 例 如 ，V4 版 本 中 的 指令 提取 流水 线 被 扩展 为 4 
个 流水 段 ， 并 包含 转移 预测 。 执 行 流水 线 被 扩展 为 5 个 流水 段 ， 其 中 前 边 的 流水 段 用 于 地 址 计 
算 ， 后 边 的 流水 段 用 于 算术 / 逻辑 运算 。 这 种 功能 的 分 离 提供 了 一 种 受 限 的 超标 量 处 理 的 形 
式 。 比 如 在 某 些 情况 下 ，Move 指令 和 另 一 条 指令 可 以 在 同一 个 周期 内 被 分 发 到 执行 流水 线 
上 上 。V5 版 本 的 处 理 器 实现 中 有 两 个 独立 的 基于 V4 结构 的 执行 流水 线 。 它 们 提供 真正 的 超标 
量 处 理 。 


6.10.2 Intel 处 理 器 中 的 流水 线 


Intel 处 理 器 使 用 超标 量 执行 和 深 流水 线 来 实现 高 性 能 。 例 如 ，Core 2 和 Core i7 体系 结构 
有 4 条 指令 的 多 发 宽度 和 一 个 14 段 的 流水 线 。 使 用 了 转移 预测 、 寄 存 器 重 命名 、 无 序 执行 和 
其 他 的 技术 。 

为 了 减少 内 部 的 复杂 性 ，CISC 风格 的 指令 由 硬件 动态 地 转换 成 简单 的 RISC 风格 的 微 操 
作 。 然 后 这 些微 操作 被 分 发 到 执行 部 件 以 完成 原来 CISC 风格 指令 所 指定 的 任务 。 这 种 方法 保 
留 了 代码 的 兼容 性 ， 同 时 使 其 能 够 使 用 为 RISC 风格 指令 集 开发 的 可 以 大 大 提升 性 能 的 技术 。 
在 某 些 情况 下 ， 为 了 更 有 效 地 处 理 ， 可 将 一 些微 操作 融合 为 宏 操作 。 例 如 ， 在 一 个 包含 原来 
CISC 风格 指令 的 程序 中 ， 一 条 影响 条 件 码 的 比较 指令 后 面 往往 是 一 条 转移 指令 。 硬 件 可 能 首 
先 将 比较 指令 和 转移 指令 转换 成 单独 的 微 操 作 ， 但 之 后 又 将 它们 融合 成 一 个 综合 的 比较 - 转移 
操作 ， 该 操作 的 功能 反映 了 RISC 风格 指令 集中 的 典型 特征 。 


6.11 结束 语 

本 章 介绍 了 性 能 提升 的 两 个 重要 特性 : 流水 线 和 指令 多 发 。 流 水 线 可 使 处 理 器 的 指令 吞吐 
量 达 到 每 个 时 钟 周期 一 条 指令 。 与 流水 线 结合 的 指令 多 发 使 得 指令 吞吐 量 为 每 个 时 钟 周期 多 条 
指令 的 超标 量 操作 成 为 可 能 。 

只 有 认真 解决 以 下 三 个 方面 的 问题 ， 才 可 以 实现 性 能 的 提高 : 

e 处 理 器 的 指令 集 

。 流水 线 硬件 的 设计 

e 相关 编译 絮 的 设计 

认识 到 三 者 之 间 的 相互 作用 是 非常 重要 的 。 在 一 个 处 理 器 的 设计 过 程 中 ， 对 这 三 者 之 间 
相互 作用 的 认识 程度 决定 性 地 影响 着 处 理 器 的 性 能 水 平 。 特 别 适 用 流水 线 执行 的 指令 集 是 现代 
处 理 器 的 关键 特征 。 

关于 本 章 所 讨论 主题 的 更 多 细节 请 参考 其 他 材料 ， 参 考 文献 [1] 涵盖 了 流水 线 的 内 容 ， 参 
考 文献 [2] 涵盖 了 超标 量 处 理 器 的 内 容 。 
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6.12 ”问题 解析 
本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解决 这 样 的 问题 。 


问题 : 考虑 下 列 指令 序列 的 流水 线 执行 : 
Add R4, R3, R2 
Or R7, R6, RS 
Subtract R8, R7, R4 


寄存 器 R2 和 R3 的 初始 值 分 别 为 4 和 8， 寄 存 器 R5 和 R6 的 初始 值 分 别 为 128 和 2。 假 设 流水 线 提 
供 从 寄存 器 RY 和 RZ ( 参见 图 5-8 ) 到 ALU 的 转发 通路 。 在 第 1 个 周期 提取 第 1 条 指令 ， 在 后 续 的 周期 
中 提取 剩 下 的 指令 。 

假设 处 理 器 使 用 操作 数 转 发 ， 画 出 类 似 于 图 6-1 的 图 ， 显 示 这 些 指 令 的 流水 线 执行 。 然 后 ， 参 考 
图 5-8， 描 述 第 4 到 第 7 个 周期 中 寄存 器 RY 和 RZ 的 内 容 。 

解答 : 此 例 中 存在 涉及 寄存 器 R4 和 R7 的 数据 依赖 性 。 在 这 两 个 寄存 器 的 新 值 被 写 人 寄存 器 文件 之 
前 Subtract 指令 就 要 用 到 它们 。 因 此 ， 当 Subtract 指令 处 于 流水 线 的 计算 阶段 时 ， 需 要 将 这 两 个 值 转发 到 
ALU 的 输入 端 。 图 6-15 给 出 了 带 转发 的 流水 线 执 行情 况 ， 其 中 一 个 箭头 表示 从 寄存 器 RZ 转发 的 寄存 器 
R7 的 新 值 ， 另 一 个 箭头 表示 从 寄存 器 RY 转发 的 寄存 器 R4 的 新 值 。 

一 一 > 时 间 
时 钟 周期 1 学 3 4 5 6 7 
Add R4,R3,R2 


Or RY7,R6,R5 


Subtract R8, R7.R4 [Flplclxlw 
图 6-15 例 6.1 中 指令 的 流水 线 执行 


至 于 第 4 到 第 7 个 周期 中 寄存 器 RY 和 RZ 的 内 容 ， 下 面 的 描述 提供 了 答案 。 
e Add 指令 使 用 寄存 器 R2 和 R3 的 初始 值 ， 在 第 3 个 周期 产生 结果 12。 在 第 4 个 周期 中 ， 可 在 寄 
存 器 RZ 中 得 到 这 个 结果 。 在 第 4 个 周期 中 ， 寄 存 器 RY 的 值 是 Add 指令 之 前 一 条 未 指定 指令 的 
结果 。 
在 第 4 个 周期 中 ，Or 指令 产生 结果 130。 该 结果 被 放 人 寄存 器 RZ 中 ， 以 便于 在 第 5 个 周期 中 使 
用 。 而 在 第 5 个 周期 ，Add 指令 的 结果 12 在 寄存 器 RY 中 。 
在 第 5 个 周期 中 ，Subtract 指令 处 于 计算 阶段 。 为 了 产生 正确 的 结果 ， 使 用 转发 来 提供 寄存 器 RY 
中 的 值 130 和 寄存 器 RZ 中 的 值 12- ALU 的 结果 是 130-12=118。 第 6 个 周期 可 在 寄存 器 RZ 中 
得 到 这 个 结果 。 第 6 个 周期 Or 指令 的 结果 130 在 寄存 器 RY 中 。 

e 在 第 6 个 周期 中 ，Subtract 指令 处 于 访 存 阶段 。Subtract 指令 后 面 的 未 指定 指令 正在 计算 阶段 产生 

结果 。 在 第 7 个 周期 中 ， 未 指定 指令 的 结果 在 寄存 器 RZ 中 ,Subtract 指令 的 结果 在 寄存 器 RY 中 。 

例 6.2 

问题 : 假设 一 个 程序 所 执行 的 动态 指令 中 有 20% 是 转移 指令 。 没 有 由 于 数据 依赖 性 而 产生 的 流水 线 
延迟 。 使 用 静态 的 转移 预测 ， 并 假设 不 会 发 生 转 移 。 

(a ) 当 发 生 30% 的 转移 和 发 生 70% 的 转移 时 ， 确 定 这 两 种 情况 的 执行 时 间 。 

(b ) 确定 一 种 情况 相对 于 另 一 种 情况 的 加 速 比 。 将 加 速 比 表 示 为 相对 于 1 的 百分比 。 

解答 : 6.8.1 节 描 述 了 考虑 转移 代价 影响 的 Sunan wmae 计算 。 

(a) 对 于 第 一 种 情况 ，6branen roaty 的 值 是 0.20 x0.30=0.06， 对 于 第 二 种 情况 ，6raner perary 的 值 是 
0.20 x 0.70=0.14。 使 用 S=1+6vranon_penary， 第 一 种 情况 的 执行 时 间 是 ( 1.06 x 入 ) /R， 第 二 种 情况 的 执行 时 间 
是 (1.14xN) /R。 
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(b ) 因为 第 一 种 情况 的 执行 时 间 比 较 少 ， 所 以 性 能 改善 的 加 速 百分比 是 


(这 一 ] x 100=7.5% 


1.06 
习题 
[M] 6.1 考虑 下 列 在 存储 器 中 给 定 地 址 处 的 指令 : 
1000 Add R3, R2, #20 
1004 Subtract RS, R4, #3 
1008 And R6, R4, #0x3A 
1012 Add R7, R2, R4 


寄存 器 R2 和 R4 的 初始 值 分 别 为 2000 和 50。 这 些 指 令 在 一 台 含 有 图 6-2 所 示 的 5 段 流 水 线 的 计 
算 机 上 执行 。 在 第 1 个 时 钟 周 期 取 第 1 条 指令 ， 在 后 续 的 周期 中 提取 剩 下 的 指令 。 
(a ) 画 出 类 似 于 图 6-1 的 图 ， 表 示 通 过 流水 线 的 指令 流 。 描 述 在 第 1 到 第 8 个 时 钟 周期 中 每 一 个 


流水 段 所 执行 的 操作 。 
(b ) 参考 图 5-8 和 图 5-9， 描 述 第 2 到 第 8 个 周期 中 流水 线 中 的 寄存 器 IR, PC, RA, RB, RY 
和 RZ 的 内 容 。 
[M] 6.2 针对 下 列 程 序 : 
1000 Add R3, R2, #20 
1004 Subtract R5, R4, #3 
1008 And R6, R3, #0x3A 
1012 Add R7, R2, R4 
重复 习题 6.1 中 的 问题 。 假 设 流水 线 提供 从 图 5-8 中 的 寄存 器 RY 和 RZ 到 ALU 的 转发 通路 ， 并 
假设 处 理 器 使 用 操作 数 转发 。 


[M] 6.3 考虑 图 2-8 所 示 程 序 中 的 循环 。 假 设 它 在 一 个 5 段 的 流水 线 上 执行 ， 该 流水 线 具有 从 图 5-8 中 的 
寄存 器 RY 和 RZ 到 ALU 的 转发 通路 。 假 设 流 水 线 使 用 静态 转移 预测 ， 并 假设 不 会 发 生 转 移 。 
画 一 个 类 似 于 图 6-1 的 图 ， 表 示 该 循环 连续 两 次 迭代 的 执行 情况 。 

[D] 6.4 重复 习题 6.3 中 的 问题 ， 但 像 编 译 器 那样 首先 重新 排列 指令 以 优化 性 能 。 

[D] 6.5 对 于 使 用 包含 有 一 个 延迟 槽 的 延迟 转移 技术 的 流水 线 ， 重 复习 题 6.3 中 的 问题 。 根 据 需 要 重新 排 
列 指令 以 提高 性 能 。 

[M] 6.6 图 6-5 中 的 转发 通路 允许 寄存 器 RZ 的 内 容 直接 在 ALU 运算 中 使 用 。 运 算 的 结果 存 到 寄存 器 RZ 
中 ， 并 替换 它 先前 的 内 容 。 本 题 要 求 在 多 个 周期 中 跟踪 寄存 器 RZ 的 内 容 。 考 虑 两 条 指令 

Ti: Add R3, R2, R1 
I»: LShiftL R3, R3, #1 

当 在 第 1 个 周期 提取 指令 I 时 ,一 条 先前 提取 的 指令 正在 执行 ALU 运算 ,给 出 一 个 结果 17。 然 
后 ， 当 在 第 2 个 周期 对 指令 1 进行 译 码 时 ， 另 一 条 先前 提取 的 指令 正在 执行 ALU 运算 ,给 出 一 
个 结果 198。 还 是 在 第 2 个 周期 ， 寄 存 器 R1,R2 和 R3 的 值 分 别 为 30,100 和 45。 使 用 这 些 信息 ， 
画 一 个 时 序 图 ， 显 示 在 第 2 到 第 5 个 周期 中 寄存 器 RZ 的 内 容 。 

[M] 6.7 假设 一 个 程序 所 执行 的 动态 指令 中 有 20% 是 转移 指令 。 使 用 包含 有 一 个 延迟 槽 的 延迟 转移 技术 。 
假设 没有 其 他 因素 造成 的 延迟 。 首 先 ， 如 果 所 有 的 延迟 槽 都 用 NOP 指令 填充 ， 推 导出 执行 时 间 
( 以 周期 为 单位 ) 的 表达 式 。 然 后 ， 如 果 70% 的 延迟 槽 被 优化 编译 器 填充 了 有 用 的 指令 ， 推 导出 
男 一 个 反映 执行 时 间 的 表达 式 。 从 这 些 表 达 式 中 ， 确 定编 译 器 对 性 能 增强 的 影响 ， 表 示 成 加 速 
分 比 的 形式 。 

[D] 6.8 对 于 含有 两 个 转移 延迟 槽 的 流水 线 处 理 器 ， 重 复习 题 6.7 中 的 问题 。 优 化 编译 器 的 输出 使 得 第 一 
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个 延迟 槽 70% 的 时 间 用 有 用 的 指令 填充 ， 但 第 二 个 延迟 槽 仅 10% 的 时 间 用 有 用 的 指令 填充 。 
将 这 种 情况 下 编译 器 优化 后 的 执行 时 间 与 习题 6.7 中 编译 器 优化 后 的 执行 时 间 进 行 比较 。 假 设 两 
个 处 理 器 具有 相同 的 时 钟 速率 。 指 出 哪 一 个 处 理 器 / 编译 器 组 合 比较 快 ， 并 指出 速度 较 快 的 那个 
组 合 的 加 速 百分比 。 

[D] 6.9 假设 一 个 程序 所 执行 的 动态 指令 中 有 20% 是 转移 指令 。 再 假设 75% 的 转移 指令 实际 上 发 生 了 转 
移 。 该 程序 在 两 个 具有 相同 时 钟 速率 的 不 同 处 理 器 上 执行 。 一 个 处 理 器 使 用 假设 转移 不 成 功 方法 
的 静态 转移 预测 。 另 一 个 处 理 器 使 用 基于 图 6-12a 中 状态 的 动态 转移 预测 。 以 6.6.4 节 中 描述 的 
方式 使 用 转移 目标 缓冲 区 。 
(a) 没有 其 他 原因 产生 流水 线 延 迟 时 ， 使 用 动态 转移 预测 的 处 理 器 与 使 用 静态 转移 预测 的 处 理 器 

表现 相同 时 其 预测 准确 率 的 最 小 值 必须 是 多 少 ? 

(b ) 如 果 动 态 预 测 准确 率 实际 为 90% 的 话 ， 那 么 相对 于 使 用 静态 预测 的 加 速 比 是 多 少 ? 

[M] 6.10 如 图 6-5 那样 转发 寄存 器 RZ 的 值 需 要 在 流水 线 中 增加 额外 的 控制 逻辑 。 该 额外 的 逻辑 必须 检 
查 什么 具体 条 件 来 确定 在 流水 线 的 计算 阶段 向 ALU 输入 端 提供 数据 的 多 路 复 用 器 的 设置 ? 

[M] 6.11 对 于 将 图 5-8 中 寄存 器 RY 的 内 容 转 发 给 向 ALU 输入 端 提供 数据 的 多 路 复 用 器 ， 重 复习 题 6.10 


中 的 问题 。 
[D] 6.12 作为 习题 6.10 和 6.11 的 延续 ， 考 虑 下 列 的 指令 序列 : 
Add R3, R2, RI1 
Subtract R3, R5, R4 
Or R8, R3, #1 


描述 在 这 种 情况 下 处 理 转 发 的 方式 。 应 该 如 何 修改 习题 6.10 和 习题 6.11 中 的 条 件 ? 

[M] 6.13 有 一 个 程序 ， 由 4 条 存储 器 访问 指令 和 4 条 算术 指令 组 成 。 假 设 指令 间 没 有 数据 依赖 性 。 该 程 
序 的 两 个 版 本 在 图 6-13 所 示 的 超标 量 处 理 器 上 执行 。 第 一 个 版 本 将 4 条 存储 器 访问 指令 按 顺序 
排列 ， 随 后 是 4 条 算术 指令 。 第 二 个 版 本 将 存储 器 访问 指令 与 算术 指令 交错 开 来 。 画 两 个 类 似 
于 图 6-14 的 图 来 比较 该 程序 两 个 版 本 的 执行 情况 。 

[E] 6.14 假设 一 个 程序 不 包含 转移 指令 ， 它 在 图 6-13 所 示 的 超标 量 处 理 器 上 执行 。 如 果 程 序 指令 由 75% 
的 算术 指令 和 25% 的 存储 器 访问 指令 组 成 ， 那么 预期 的 最 佳 执行 时 间 是 多 少 个 周期 7 如 果 使 用 
相同 的 时 钟 ， 将 这 个 时 间 与 图 6-2 中 简单 处 理 器 上 的 最 佳 执行 时 间 进 行 比 较 。 

[M] 6.15 假设 程序 指令 由 15% 永远 不 会 发 生 转 移 的 转移 指令 、65% 的 算术 指令 和 20% 的 存储 器 访问 指 
令 组 成 ， 重 复习 题 6.14 中 的 问题 ， 为 图 6-2 和 图 6-13 中 的 处 理 器 找 出 可 能 的 最 佳 执行 时 间 。 假 
设 所 有 转移 指令 的 预测 准确 率 为 100% 。 

[E] 6.16 有 一 个 处 理 器 ， 使 用 图 6-12b 所 示 的 转移 预测 方案 。 该 处 理 器 的 指令 集 增加 了 一 个 功能 ， 就 是 
可 以 使 编译 器 为 每 条 转移 指令 指定 初始 预测 状态 为 LT 或 者 LNT。 处 理 器 在 执行 程序 时 ， 如 果 
在 转移 目标 缓冲 区 中 没有 找到 有 关 转 移 指 令 的 信息 时 就 使 用 这 个 初始 状态 。 当 为 下 列 两 种 情况 
生成 代码 时 ， 讨 论 编译 器 如 何 使 用 这 项 功能 。 

(a) 有 一 个 循环 ， 在 其 末尾 有 一 条 转移 到 循环 开始 处 的 条 件 转移 指令 。 
(b ) 有 一 个 循环 ， 在 其 开始 处 有 -一 条 转移 到 循环 出 口 的 条 件 转移 指令 ， 在 其 末尾 有 一 条 转移 到 
循环 开始 处 的 无 条 件 转移 指令 。 

[M] 6.17 假设 一 个 处 理 器 具有 习题 6.16 所 描述 的 功能 ， 可 以 为 转移 指令 指定 初始 预测 状态 。 考 虑 一 个 语 
名 格式 

IF A>B THEN A=A+!1 ELSE B=B+l 
(a) 为 上 面 的 语句 生成 汇编 语言 代码 。 
(b) 在 没有 任何 其 他 信息 的 情况 下 ， 讨 论 编译 器 如 何 用 汇编 代码 为 转移 指令 指定 初始 预测 状态 。 
(c ) 对 含有 上 述 语句 程序 的 执行 行为 的 研究 表明 ， 变 量 A 的 值 通常 大 于 变量 B 的 值 。 如 果 编 译 
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器 可 以 得 到 这 些 信息 ， 讨 论 这 些 信 息 如 何 影响 该 转移 指令 的 初始 预测 状态 。 
[M] 6.18 考虑 一 个 语句 形式 
IF A>B THEN A=A+!1 ELSE B=B+1 

(a) 考虑 一 个 具有 图 6-2 所 示 流 水 线 结构 的 处 理 器 ， 它 使 用 转移 不 成 功 假设 的 静态 转移 预测 。 
为 上 述 语 句 编写 汇编 语言 代码 。 画 出 类 似 于 图 6-1 的 图 ， 以 显示 不 同 转移 决策 时 指令 的 流 
水 线 执行 情况 ， 并 确定 执行 时 间 ( 以 周期 为 单位 )。 

(b ) 现在 假设 使 用 延迟 转移 技术 ， 为 上 述 语 句 编写 汇编 语言 代码 。 画 图 显示 采用 不 同 转移 决策 
时 指令 的 流水 线 执行 情况 ， 并 将 执行 时 间 ( 以 周期 为 单位 ) 跟前 一 种 情况 中 的 时 间 进 行 
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输入 / 输出 组 织 结构 





本 章 目标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

。 访问 VO 设备 所 需 的 硬件 

。 接口 电路 

e 商业 标准 ,如 USB、SAS 和 PCI Express 

计算 机 的 一 个 基本 特性 是 具有 与 VO 设备 进行 数据 传送 的 能 力 。 这 一 通信 和 能力 使 操作 员 可 
以 完成 很 多 操作 ， 例 如 ， 用 键盘 和 显示 屏幕 来 处 理 文本 和 图 形 。 实 际 中 ， 我 们 广泛 地 使 用 计算 
机 通过 Internet 与 其 他 计算 机 通信 并 访问 全 球 信息 。 此 外 ， 在 髓 入 式 应 用 中 ， 计算机 虽然 不 是 
很 直观 ,但 仍 有 着 同等 重要 的 作用 。 它 们 是 家 用 电器 、 制 造 设备 、 车 辆 系统 、 手 机 、 银 行 和 销 
售 点 终端 的 集成 部 分 。 在 这 些 应 用 中 ， 计 算 机 的 输入 可 能 来 自 触 摸 板 、 传 感 器 开关 、 数 字 照 相 
机 、 麦 克 风 或 火警 报警 器 ; 输出 可 能 是 需要 显示 的 字符 或 数字 、 发 送 给 扬声器 的 声音 信号 或 用 
来 改变 发 动机 速度 、 打 开 阀 门 或 使 机 器 人 按 指定 方式 移动 的 数字 编码 命令 。 

计算 机 应 该 具备 与 各 种 各 样 的 设备 交换 信息 的 能 力 。 在 很 多 情况 下 ， 处 理 器 全 程 参 与 到 
这 些 交 换 活动 中 。 但 是 ， 数 据 传输 也 可 以 直接 在 IO 设备 ( 比如 磁盘 ) 和 主 存 之 间 进 行 ， 处 理 
器 只 需 最 低 限 度 地 参与 数据 传输 过 程 。 这 种 可 能 性 将 在 下 一 章 存储 器 系统 中 进行 探讨 。 

第 3 章 介绍 了 如 何 从 程序 员 的 角度 看 待 在 处 理 器 与 IO 设备 接口 寄存 器 之 间 发 生 的 输入 / 
输出 数据 传输 操作 。 在 本 章 中 ， 我 们 将 讨论 为 实现 此 类 传输 所 需 的 硬件 细节 。 

互连网 络 被 用 来 在 处 理 器 、 存 储 器 和 LO 设备 之 间 传 输 数据 。 下 面 我 们 将 描述 一 种 常用 的 
称 为 总 线 (bus ) 的 互连网 络 。 


7.1 总 线 结构 

图 7-1 所 示 的 总 线 是 实现 图 3-1 中 互 
连 网 络 的 一 种 简单 结构 。 在 任 一 时 刻 都 只 
能 有 一 对 源 / 目的 单元 使 用 该 总 线 来 传输 
数据 。 

”总 线 由 三 组 线路 组 成 ， 分 别 用 来 传输 

地 址 、 数 据 和 控制 信号 。LO 设备 接口 连 
接 到 这 些 线路 上 ， 如 图 7-2 所 示 的 输入 设 
备 与 这 些 线路 的 连接 。 每 一 个 IO 设备 接口 中 的 寄存 器 都 被 分 配 了 唯一 的 一 组 地 址 。 当 处 理 器 
将 一 个 特定 的 地 址 放置 到 地 址 线 上 时 ， 总 线 上 所 有 设备 的 地 址 译 码 器 都 会 检查 这 个 地 址 。 识 别 
出 这 个 地 址 的 设备 就 会 对 控制 线 上 的 命令 做 出 响应 。 处 理 器 使 用 控制 线 来 请 求 一 个 读 或 者 写 操 
作 ， 所 请 求 的 数据 则 在 数据 线 上 传输 。 

如 3.1 节 所 述 ， 当 IO 设备 和 存储 器 共享 同一 个 地 址 空间 时 ， 这 种 方式 被 称 为 存储 器 映射 
IO (memory-mapped IO )。 任 何 能 够 访问 存储 器 的 机 器 指令 也 都 可 以 用 来 与 IO 设备 进行 数据 
传输 。 例 如 ， 如 果 图 7-2 中 的 输入 设备 是 一 个 键盘 ， 且 DATAIN 是 键盘 的 数据 寄存 器 ， 则 指令 






图 7-1 单 总 线 结构 
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数据 、 状 态 和 | 
地 址 译 码 器 | | 控制 电路 | | “控制 寄存 器 


输入 设备 


图 7-2 输入 设备 的 IO 接口 


IO 接口 











Load R2, DATAIN 


将 从 DATAIN 中 读 取 数 据 并 将 其 存储 到 处 理 器 寄存 器 R2 中 。 类 似 地 ， 指 令 

Store R2, DATAOUT 
将 寄存 器 R2 的 内 容 发 送 到 DATAOUT 中 ，DATAOUT 可 能 是 显示 设备 接口 的 数据 寄存 器 。 状 
态 寄 存 器 与 控制 寄存 器 包含 与 IO 设备 操作 有 关 的 信息 。 地 址 译 码 器 、 数 据 寄存 器 和 状态 寄存 
器 以 及 协调 IO 传输 所 需 的 控制 电路 构成 了 设备 的 接口 电路 。 


7.2 ”总线 操作 

总 线 需要 一 组 通常 被 称 为 总 线 协 议 (bus protocol ) 的 规则 ， 用 来 管理 各 种 设备 如 何 使 用 总 
线 。 总 线 协 议决 定 设备 何 时 可 以 将 信息 放 到 总 线 上 ， 何 时 可 以 将 总 线 上 的 数据 装 和 人 设备 的 寄 
存 器 中 ， 等 等 。 这 些 规则 将 通过 控制 信号 来 实现 ， 控 制 信号 指示 什么 时 候 可 以 采取 什么 样 的 
动作 。 : 

一 根 控制 线 ， 通 常 标记 为 RW， 指 定 要 执行 读 还 是 写 操作 。 如 同 这 个 标签 所 指示 的 ， 当 
它 被 置 为 1 时 表示 进行 读 操 作 ， 被 置 为 0 时 表示 进行 写 操作 。 在 允许 传输 不 同 长 度 的 数据 时 ， 
如 字 节 、 半 字 或 字 ， 所 需 的 长 度 由 其 他 的 控制 线 来 表示 。 总 线 的 控制 线 还 要 传送 时 序 信息 。 这 
些 信 息 详 细 说 明 处 理 器 和 IO 设备 何 时 可 以 将 数据 放 到 数据 线 上 或 从 数据 线 上 接收 数据 。 目 前 
已 设计 出 多 种 数据 传输 时 序 的 方式 ， 大 致 可 以 分 为 同步 和 异步 两 种 。 

在 任何 数据 传输 操作 中 都 有 一 台 设 备 扮演 主 控 器 或 主 控 设 备 (master ) 的 角色 。 它 通过 在 
总 线 上 发 送 读 或 写 命令 来 启动 数据 传输 。 通 常 ， 处 理 器 是 总 线 主 控 器 ， 但 在 7.3 节 中 我 们 将 看 
到 ， 其 他 设备 也 可 以 成 为 总 线 主 控 器 。 被 主 控 设备 寻 址 的 设备 称 为 从 动 设备 ( slave )。 


7.2.1 同步 总 线 

在 同步 (synchronous ) 总 线 上 ， 所 有 设备 都 从 一 根 叫 做 总 线 时钟 (bus clock ) 的 控制 线 上 
获取 时 序 信息 ， 如 图 7-3 的 顶部 所 示 。 该 控制 线 上 的 信号 有 两 个 相位 ( phase ) : 一 个 高 电 平和 
一 个 紧 跟 着 的 低 电 平 。 两 个 相位 组 成 了 一 个 时 钟 周期 (clock cycle )。 时 钟 周期 的 前 半 部 分 ， 即 
电 平 的 低 到 高 转换 与 高 到 低 转 换 之 间 的 那 部 分 通常 被 称 为 时 钟 脉冲 。 

在 图 7-3 中 的 地 址 线 和 数据 线 显 示 好 像 它们 可 以 同时 传送 高 电 平和 低 电 平 信 和 号。 有些 线 上 


是 高 电 平 有 些 线 上 是 低 电 平 ， 这 是 一 种 通用 的 约定 表示 方式 ， 具 体 依赖 于 正在 传输 的 特定 地 址 ”. 


和 数据 值 。 交 点 表示 的 是 这 些 模 式 发 生变 化 的 时 间 。 处 于 高 低 电 平 之 间 的 中 间 电 平 的 信号 线 表 
示 信 号 不 可 靠 的 时 段 ， 所 有 设备 必须 忽略 这 段 时 间 的 信号 。 
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我 们 来 看 一 下 在 一 次 输入 读 ) 操作 期 间 信号 事件 发 生 的 顺序 。 在 时 刻 时 ， 总 线 主 控 
器 将 设备 地 址 放 到 地 址 线 上 并 在 -有 
控制 线 上 发 送 一 条 表示 读 操 作 的 本 
命令 。 这 个 命令 还 可 以 指明 将 要 一 
读 取 的 操作 数 的 长 度 。 信 息 在 总 ”san [| _ 
线 上 的 传输 速度 取决 于 总 线 的 物 
理 和 电气 特性 。 时 钟 脉冲 的 宽度 
4 一 必须 大 于 总 线 上 的 最 大 传 “地址 和 命令 
播 延迟 。 而 且 ， 该 时 间 要 长 到 保 
证 所 有 设备 对 地 址 和 控制 信号 进 数据 
行 译 码 ， 从 而 使 得 被 寻 址 的 设备 
( 从 动 设备 ) 能 够 在 时 间 4 进行 响 
应 ,将 请 求 的 输入 数据 放 到 数据 
线 上 。 该 时 钟 周期 结束 时 ， 也 就 图 7-3 同步 总 线 上 的 输入 传输 时 序 
是 在 时 间 时 ， 主 控 设备 将 数据 线 上 的 数据 装 入 它 的 某 一 个 寄存 器 中 。 要 使 数据 能 够 正确 地 装 
入 寄存 器 中 ， 数 据 的 有 效 时 间 必 须 大 于 寄存 器 的 准备 时 间 (参见 附录 A )。 因 此 ，b -4 这 段 时 
间 必须 大 于 总 线 上 的 最 大 传输 时 间 与 主 控 设备 寄存 器 的 准备 时 间 之 和 。 

写 操 作 也 有 类 似 的 过 程 。 主 控 设备 在 发 送 地 址 和 命令 信息 的 同时 也 将 输出 数据 放置 到 数 
据 线 上 。 在 时 间 ， 被 寻 址 的 设备 将 数据 装 人 自己 的 数据 寄存 器 中 。 

图 7-3 中 的 时 序 图 是 总 线 线 一 时 间 
路 上 所 发 生动 作 的 一 种 理想 化 表 & 线 外 | 1 | 
示 。 实 际 中 信号 变换 状态 的 确切 
时 间 与 图 中 显示 的 有 些 差别 ， 因 ” 主 控 设备 见 到 的 
为 在 总 线 线路 和 设备 电路 上 存在 ” 地 址 和 命令 
着 传输 延迟 。 图 7-4 给 出 了 一 个 更 数据 
接近 实际 情况 的 图 。 在 这 幅 图 中 
除了 时 钟 以 外 ， 每 个 信号 都 显示 
了 两 个 图 像 。 因 为 信号 要 花费 时 ”从 动 设备 见 到 的 
间 从 一 台 设备 传送 到 另 一 台 设 备 ， 地 址 和 命令 
所 以 不 同 的 设备 见 到 同一 信和 号 跳 数据 
变 的 时 间 不 同 。 上 面 的 图 像 显示 
的 是 主 控 设 备 见 到 的 信号 ， 而 下 
面 的 图 像 显 示 的 则 是 从 动 设备 见 图 7-4 对 应 图 7-3 ， 更 详细 的 输入 传输 时 序 图 
到 的 信号 。 我 们 假设 连接 到 总 线 上 的 所 有 设备 见 到 时 钟 变 换 的 时 间 相同 。 系 统 设计 者 需要 花费 
相当 大 的 精力 来 确保 时 钟 信号 能 满足 这 一 要 求 。 

主 控 设 备 在 时 钟 周期 开始 的 时 钟 上 升 沿 (加 ) 发 送 地 址 和 命令 信和 号。 但 由 于 从 主 控 设备 到 
总 线 线路 的 电子 电路 输出 端的 延迟 ， 在 taw 之 前 ， 这 些 信号 并 不 真正 出 现在 总 线 上 。 很 短 的 时 
间 之 后 ， 在 ts 时 刻 ， 信 号 到 达 从 动 设备 。 从 动 设备 对 地 址 信号 进行 译 码 ， 并 在 #1 时 刻 发 送 所 
请 求 的 数据 。 同 样 ， 数 据 信号 直到 ms 时 刻 才 出 现在 总 线 上 。 它 们 向 主 控 设备 方向 传输 ， 在 tow 
时 刻 到 达 。 在 时 刻 ， 主 控 设备 将 数据 装 人 它 的 寄存 器 中 。 因 此 ，4 - tow 这 段 时 间 必须 大 于 
主 控 设备 寄存 器 的 准备 时 间 。 数 据 在 & 后 必须 保持 有 效 一 段 时 间 ， 这 上段 时 间 等 于 该 寄存 器 的 保 
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持 时 间 (保持 时 间 参 见 附录 A )。 
时 序 图 常常 只 给 出 图 7-3 中 的 简化 图 ， 尤 其 是 在 介绍 数据 是 如 何 传输 的 基本 思想 时 。 但 
是 ,实际 信号 总 是 包含 有 图 7-4 所 示 的 延迟 。 
多 周期 数据 传输 
按照 上 面 描述 的 方式 我 们 可 以 得 到 设备 接口 的 一 种 简单 设计 方式 。 但是， 这 种 方式 有 它 
的 局 限 性 。 因 为 每 次 传输 必须 在 一 个 时 钟 周期 内 完成 ， 时 钟 周期  - 必须 满足 总 线 上 最 长 的 
时 间 延 迟 和 最 慢 的 设备 接口 。 这 将 迫使 所 有 设备 都 以 最 慢 设备 的 速度 工作 。 
此 外 ， 处 理 器 也 不 能 确定 被 寻 址 的 设备 是 否 已 经 响应 。 在 时 刻 ， 它 简单 地 假定 读 操作 
中 的 输入 数据 已 在 数据 线 上 有 效 ， 或 写 操作 中 的 输出 数据 已 经 被 /O 设备 接收 。 但 如 果 由 于 故 
障 ， 设 备 不 能 正常 运行 ， 则 无 法 检测 到 该 错误 。 
为 克服 这 些 局 限 性 ， 大 部 分 总 线 都 有 表示 设备 响应 的 控制 信号 。 这 些 信号 通知 主 控 设备 
从 动 设备 已 经 识别 了 它 的 地 址 并 准备 好 参与 数据 传输 操作 了 。 也 可 以 调整 数据 传输 周期 的 脉冲 
宽度 来 匹配 不 同 设备 的 响应 速度 。 通 常 我 们 会 让 一 个 完整 的 数据 传送 操作 跨越 多 个 时 钟 周 期 来 
实现 这 一 点 。 因 此 ， 不 同 设 备 传输 数据 所 需 的 时 钟 周期 数 就 有 可 能 不 同 。 
图 7-5 所 示 的 是 多 时 钟 周期 传输 的 一 
个 例子 。 在 时 钟 周期 1 期 间 ， 主 控 设备 将 上 | 
地 址 和 命令 信息 发 送 到 总 线 上 请 求 一 次 读 时 钟 | 1 | | 「 | | 
操作 。 从 动 设备 接收 到 这 个 信息 并 将 其 译 
码 ， 并 在 时 钟 周期 2 开始 时 的 时 钟 上 升 沿 地 址 
开始 访问 被 请 求 的 数据 。 我 们 已 经 假设 在 
获取 数据 的 过 程 中 存在 延迟 ， 所 以 从 动 设 
备 不 能 立即 响应 。 在 时 钟 周 期 3 期 间 数 据 数据 
已 准备 好 并 被 放置 到 总 线 上 。 同 时 ， 从 动 
设备 发 出 从 动 就 绪 控 制 信号 。 在 该 时 钟 周 ”从 动 就 绪 
期 结束 时 ， 一 直 在 等 待 这 个 信号 的 主 控 设 
备 把 数据 装 入 它 的 寄存 器 中 。 在 时 钟 周期 图 95 产 时 名 用 期 的 输入 仿 斩 
3 结束 时 ， 从 动 设备 从 总 线 上 撤销 数据 信号 并 将 从 动 就 绪 控 制 信号 退回 到 低 电 平 。 至 此 总 线 传 
送 操作 完成 ， 主 控 设备 可 以 在 时 钟 周期 4 发 送 新 的 地 址 和 命令 信号 来 启动 一 次 新 的 传送 过 程 。 
从 动 就 绪 信 号 是 从 动 设备 对 主 控 设备 的 应 答 ， 它 确认 被 请 求 的 数据 已 经 被 放置 到 总 线 上 
了 。 从 动 就 绪 信号 还 使 得 不 同 设备 的 总 线 传输 脉冲 宽度 可 以 不 同 。 在 图 7-5 的 例子 中 ， 从 动 设 
备 在 周期 3 响应 。 其 他 不 同 的 设备 可 能 在 较 早 或 稍 后 的 周期 中 响应 。 如 果 被 寻 址 的 设备 根本 不 
响应 ， 主 控 设 备 等 待 预先 确定 的 最 大 时 钟 周 期 数 后 就 放弃 这 次 操作 。 这 可 能 是 由 于 地 址 错误 或 
设备 故障 导致 的 。 
现在 我 们 将 介绍 一 种 不 使 用 时 钟 信和 号 的 方法 。 


7.2.2 异步 总 线 

控制 总 线 上 数据 传输 的 男 一 种 方式 是 基于 主 控 设 备 和 从 动 设备 之 间 的 握手 ( handshake ) 
协议 。 握 手 是 在 主 控 设备 和 从 动 设备 之 间 交 换 命令 和 响应 信号 。 它 是 图 7-5 中 从 动 就 绪 信 号 使 
用 方式 的 泛 化 。 一 根 被 称 为 主 控 就 绪 的 控制 线 由 主 控 设备 启动 ， 表 示 它 已 经 准备 好 开始 数据 传 
输 了 ， 从 动 设备 则 通过 启动 从 动 就 绪 信 号 来 响应 。 


一 一 ~ 时 间 
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握手 协议 控制 的 数据 传送 按照 如 下 步骤 进行 。 主 控 设 备 将 地 址 和 命令 信息 放 到 总 线 上 。 
然后 它 激活 主 控 就 绪 线 来 通知 所 有 设备 它 已 经 将 地 址 和 命令 信息 放 到 总 线 上 了 。 这 使 得 所 有 设 
备 对 该 地 址 进行 译 码 。 被 选 定 的 从 动 设备 执行 请 求 的 操作 ， 并 激活 从 动 就 绪 线 来 通知 处 理 器 它 
已 经 准备 好 。 主 控 设备 等 待 从 动 就 绪 线 有 效 后 ， 将 自己 的 信号 从 总 线 上 撤销 。 在 读 操作 中 ， 主 
控 设备 还 需要 将 数据 装 入 它 的 寄存 器 中 。 

图 7-6 给 出 了 一 个 基于 握手 协议 一 一 时 间 
的 输入 数据 传输 操作 的 时 序 实例 ， 它 ”地 址 和 命令 
描述 了 如 下 的 事件 序列 : 

to 一 一 主 控 设备 将 地 址 和 命令 信 主 控 就 绪 
息 放 到 总 线 上 ， 总 线 上 的 所 有 设备 对 
该 信息 进行 译 码 。 Ma 

t 一 一 主 控 设 备 将 主 控 就 绪 线 置 数据 
为 1， 通 知 所 有 设备 地 址 和 命令 信息 
已 经 放 到 总 线 上 了 。t - w 的 延迟 用 来 
补偿 总 线 上 出 现 的 相位 偏 移 ( skew )。 

当 同 一 信号 源 同 时 发 送 的 两 个 信号 不 总 线 周 其 
同时 到 达 目 的 地 时 ， 就 会 出 现 相 位 偏 图 7-6 输入 操作 中 数据 传输 的 握手 控制 

移 。 这 是 由 总 线 中 不 同 线路 的 传播 速度 不 同 导致 的 。 因 此 ， 为 了 保证 主 控 就 绪 信 号 不 在 地 址 和 
命令 信息 之 前 到 达 任 何 设 备 ， 延 迟 t1 -应 该 长 于 最 大 的 总 线 相位 偏 移 。( 注意 : 在 同步 情况 
下 ， 总 线 相 位 偏 移 是 最 大 传播 延迟 的 一 部 分 。) 要 保证 设备 接口 电路 有 足够 的 时 间 进 行 地 址 译 
码 ， 这 个 延迟 也 应 该 包含 在 4 一 内。 

一 一 被 选 定 的 从 动 设备 在 对 地 址 和 命令 信息 译 码 后 ， 将 它 的 数据 放 到 数据 线 上 来 执行 请 
求 的 输入 操作 。 同 时 ， 将 从 动 就 绪 信 号 置 为 1。 如 果 在 将 数据 放 到 总 线 之 前 接口 电路 产生 了 额 
外 延迟 ， 从 动 设 备 必 须 相 应 地 延迟 从 动 就 绪 信号 - # - 这 段 时 间 的 大 小 依赖 于 主 控 设 备 和 从 
动 设备 之 间 的 距离 以 及 从 动 设备 电路 所 产生 的 延迟 。 

6 一 一 从 动 就 绪 信 号 到 达 主 控 设 备 ， 表 示 输 入 数据 已 经 在 总 线 上 可 用 。 主 控 设 备 必 须 允 许 
总 线 相位 偏 移 。 此 外 ， 还 必须 允许 主 控 设 备 寄 存 器 所 需 的 准备 时 间 。 在 延迟 了 最 大 总 线 相位 偏 
移 和 最 小 准备 时 间 之 后 ， 主 控 设 备 将 数据 装 入 它 的 寄存 器 中 ， 然 后 撤销 主 控 就 绪 信 号 ， 表 示 它 
已 经 收 到 数据 。 

4 一 一 主 控 设 备 从 总 线 上 撤销 地 一 时间 
址 和 命令 信息 。 4 与 # 之 间 的 延迟 也 地址 和 命令 
是 用 来 补偿 总 线 相位 偏 移 的 。 因 为 如 
果 设 备 在 总 线 上 见 到 的 地 址 发 生变 数据 
化 ， 而 主 控 就 绪 信号 仍然 等 于 1， 就 
会 产生 错误 的 寻 址 。 主 控 就 绪 

ts 一 一 当 设 备 接 口 收 到 主 控 就 绪 
信和 号 从 1 到 0 的 跳 变 后 ， 就 从 总 线 上 从 动 就 绪 
撤销 数据 和 从 动 就 绪 信 号 。 此 时 输入 
传输 结束 。 

图 7-7 显 示 的 是 输出 操作 的 时 总 线 周期 
序 ， 实质 上 与 输入 操作 相同 。 在 输出 图 7-7 输出 操作 中 数据 传输 的 握手 控制 
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操作 中 ， 主 控 设备 在 将 输出 数据 放置 到 数据 总 线 的 同时 发 送 地 址 和 命令 信息 。 选 定 的 从 动 设备 
收 到 主 控 就 绪 信 号 后 将 数据 装 入 它 的 数据 寄存 器 中 ， 并 将 从 动 就 绪 信 号 置 1 来 表示 它 已 经 接收 
到 数据 了 。 这 个 周期 的 其 余部 分 与 输入 操作 相同 。 

图 7-6 和 图 7-7 中 的 握手 信和 号 被 认为 是 完全 互 锁 ( fully interlocked ) 的 ， 因 为 一 个 信和 号 的 
变化 通常 是 对 另 一 个 信号 变化 的 响应 。 因 此 ， 这 种 方式 被 称 为 完全 握手 〈fnull handshake ) 方 
式 。 它 提供 了 最 高 程度 的 灵活 性 和 可 靠 性 。 

讨论 

在 商业 计算 机 中 使 用 了 许多 与 上 述 类 似 的 总 线 协 议 。 具 体 设 计 的 选择 需要 权衡 如 下 因素 : 

。 接口 电路 的 简单 性 。 

e 适应 具有 不 同 延迟 的 设备 接口 的 能 力 。 

e 总 线 传输 需要 的 总 时 间 。 

e 由 于 寻 址 不 存在 的 设备 或 者 由 于 接口 故障 所 导致 的 错误 检测 能 力 。 

异步 总 线 的 主要 优点 是 握手 协议 不 需要 发 布 一 个 所 有 设备 能 够 在 同一 时 间 见 到 的 单一 时 
钟 信号 ， 从 而 简化 了 时 序 设计 。 接 口 电 路 或 在 总 线 线 路 上 进行 传播 所 产生 的 延迟 都 可 以 很 容 
易 地 解决 。 这 些 延 迟 可 能 随 着 设备 的 不 同 而 不 同 ， 但 数据 传输 的 时 序 可 以 自动 地 进行 调整 。 
而 对 于 同步 总 线 ， 时 钟 电路 必须 仔细 设计 以 确保 正确 的 时 序 ， 并 且 延 迟 也 必须 严格 控制 在 一 
定 范围 之 内 。 

由 握手 协议 控制 的 异步 总 线 上 的 数据 传送 ， 由 于 每 一 次 传送 都 要 包括 两 个 来 回 的 延迟 
(四 个 端 到 端的 延迟 )， 所 以 传输 速率 受到 很 大 的 限制 。 从 图 7-6 和 图 7-7 中 我 们 可 以 看 出 ， 从 
动 就 绪 信 号 必须 等 到 主 控 就 绪 信和 号 的 转变 到 达 后 才能 转变 ， 反 之 亦 然 。 在 同步 总 线 中 ， 时 钟 周 
期 只 需 满足 一 个 来 回 的 延迟 即 可 。 因 此 ， 同 步 总 线 可 以 得 到 更 高 的 传输 速率 。 对 于 较 慢 的 设 
备 ， 只 需 像 前 面 讲 过 的 那样 使 用 附加 的 时 钟 周期 即 可 。 今 天 我 们 使 用 的 大 部 分 高 速 总 线 都 是 使 
用 同步 方法 。 


7.2.3 电气 考虑 

总 线 是 若干 设备 之 间 相互 连接 的 媒介 。 因 此 有 必要 保证 在 任何 给 定 的 时 间 只 能 有 一 个 设 
备 可 以 将 数据 放置 在 总 线 上 。 在 总 线 上 放置 数据 的 逻辑 门 被 称 为 总 线 驱动 器 (bus driver )。 除 
正在 发 送 数据 的 设备 之 外 ， 所 有 连接 到 总 线 上 的 其 他 设备 都 必须 将 其 总 线 驱动 器 关闭 。 一 个 被 
称 为 三 态 门 (tri-state gate ) 的 特殊 类 型 的 逻辑 门 可 以 用 于 此 目的 。 三 态 门 有 一 个 控制 输入 端 ， 
用 来 将 三 态 门 打开 或 关闭 。 当 三 态 门 被 打开 或 者 启用 时 ， 它 将 根据 输入 信和 号 的 值 用 1 或 0 驱动 
总 线 。 当 三 态 门 被 关闭 或 者 禁用 时 ， 它 将 有 效 地 与 总 线 断 开 连 接 。 从 电气 的 角度 来 说 ， 三 态 门 
的 输出 进入 高 阻抗 状态 ， 所 以 不 会 影响 总 线 上 的 信和 号 。 


7.3 ”总 线 仲 裁 


有 些 时 候 两 个 或 多 个 设备 会 竞争 使 用 计算 机 系统 中 的 某 个 资源 。 例 如 ， 两 个 设备 可 能 同 
时 需要 访问 一 个 给 定 的 从 动 设 备 。 在 这 种 情况 下 ， 需 要 决定 哪个 设备 可 以 首先 访问 从 动 设备 。 
这 通常 由 仲裁 者 (arbiter ) 电路 通过 执行 一 个 仲裁 过 程 来 作出 决定 。 每 个 设备 发 出 使 用 共享 资 
源 的 请 求 (request ) 时 启动 仲裁 过 程 。 仲 裁 者 给 每 一 个 请 求 分 配 一 个 优先 级 。 如 果 仲 裁 者 同时 
接收 到 两 个 请 求 ， 它 将 把 从 动 设 备 的 使 用 权 优 先 授 予 ( grant ) 给 拥有 较 高 优先 级 的 设备 。 

为 了 说 明 仲裁 过 程 ， 我 们 考虑 如 下 情况 : 一 条 单一 的 总 线 是 共享 资源 ， 在 总 线 上 启动 数 
据 传输 请 求 的 设备 是 总 线 主 控 设 备 。 在 7.2 节 的 讨论 中 仅 涉及 一 个 总 线 主 控 设 备 ， 也 就 是 处 理 
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器 。 但 是 有 可 能 的 是 计算 机 系统 中 的 多 个 设备 都 想 成 为 总 线 主 控 设备 来 传输 数据 。 例 如 ，LO 
设备 想 成 为 总 线 主 控 设 备 来 直接 与 计算 机 的 存储 器 进行 数据 传输 。 因 为 总 线 是 一 个 单一 的 共享 
设备 ， 所 以 总 线 主 控 设 备 必 须 有 次 序 地 访问 总 线 。 

想 要 使 用 总 线 的 设备 发 送 请 求 给 仲裁 者 。 当 多 个 请 求 同 时 到 达 的 时 候 ， 仲 裁 者 选择 一 个 
请 求 并 把 总 线 使 用 权 授予 给 相应 的 设备 。 对 于 某 些 设备 来 说 ， 获 得 总 线 使 用 权 的 延迟 会 导致 错 
误 发 生 ， 所 以 必须 给 这 些 设备 分 配 较 高 的 优先 级 。 如 果 没 有 特别 紧急 的 请 求 ， 则 仲裁 者 会 使 用 
一 种 简单 的 轮转 法 把 总 线 使 用 权 轮 流 授 予 给 各 个 设备 。 

图 7-8 显示 了 包含 两 个 总 线 主 控 设 备 的 总 线 仲裁 情况 。 有 两 根 总 线 请 求 线 BR1 和 BR2， 
以 及 两 根 总 线 授权 线 BG1 和 BG2 将 仲裁 者 与 主 控 设备 连接 起 来 。 总 线 主 控 设备 通过 激活 它 的 
总 线 请 求 线 来 请 求 使 用 总 线 。 如 果 只 有 一 根 总 线 请 求 线 被 激活 ， 则 仲裁 者 激活 相应 的 总 线 授权 
线 。 对 于 选 定 的 主 控 设备 来 说 这 意味 着 现在 它 可 以 使 用 总 线 传输 数据 了 。 当 传输 结束 时 ， 主 控 
设备 释放 其 总 线 请 求 线 ， 仲 裁 者 也 释放 该 主 控 设备 的 总 线 授权 线 。 
BR1 BR2 


| 上 仲裁 者 电路 |  ” ”」‖ 主 控 设备 2 






图 7-8 总 线 仲 裁 


图 7-9 说 明了 包含 三 个 总 线 主 控 设 备 时 可 能 发 生 的 事件 序列 。 假 设 主 控 设 备 1 拥有 最 高 
的 优先 级 ， 接 下 来 是 主 控 设 备 2， 而 主 控 设 备 3 的 优先 级 最 低 。 主 控 设 备 2 首先 发 送 一 个 使 用 
总 线 的 请 求 。 因 为 此 时 没有 其 他 请 求 ， 所 以 仲裁 者 启用 BG2 将 总 线 授 权 给 该 主 控 设备 。 当 主 
控 设 备 2 完成 数据 传输 操作 时 ， 它 通过 释放 BR2 来 释放 总 线 。 在 那 同 时 ， 主 控 设 备 1 和 3 都 
启用 了 它们 的 总 线 请 求 线 。 因 为 设备 1 拥有 更 高 的 优先 级 ， 所 以 仲裁 者 在 释放 BG2 之 后 就 激 
活 了 BG1， 从 而 将 总 线 授权 给 主 控 设备 1。 之 后 ， 当 主 控 设备 1 通过 释放 BR1 来 释放 总 线 时 ， 
仲裁 者 释放 BG1 并 激活 BG3 以 把 总 线 授权 给 主 控 设备 3。 注意 ， 即 使 主 控 设备 3 在 主 控 设备 
1 之 前 激活 请 求 线 ， 总 线 也 会 先 授 权 给 主 控 设 备 1。 


= 时间 








BG3 
图 7-9 基于 优先 级 的 总 线 使 用 授权 
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7.4 接口 电路 

设备 的 IO 接口 是 由 将 设备 连接 到 总 线 上 的 电路 组 成 的 。 在 接口 的 一 侧 有 总 线 地 址 线 、 
数据 线 和 控制 线 。 在 另 一 侧 有 接口 与 IO 设备 之 间 传 输 数 据 所 需 的 连接 ， 这 一 侧 称 为 端口 
(port )， 它 可 以 是 并 行 或 串 行 的 端口 。 并 行 端口 每 次 可 以 同时 传输 多 位 数据 。 而 串 行 端口 每 次 
只 能 发 送 或 接收 1 位 数据 。 与 处 理 器 的 通信 对 于 两 种 方式 来 说 都 是 一 样 的 ， 并 行 格式 和 串 行 格 
式 之 间 的 转换 在 接口 电路 中 完成 。 

在 介绍 具体 的 电路 实例 之 前 ， 首 先 回顾 一 下 LO 接口 的 功能 。 根 据 3.1 节 的 内 容 ，LO 接口 : 

1 ) 提供 一 个 临时 存储 数据 的 寄存 器 。 

2 ) 包含 一 个 状态 寄存 器 ， 其 中 含有 可 被 处 理 器 访问 的 状态 信息 。 

3 ) 包含 一 个 控制 寄存 器 ， 其 中 保存 着 管理 接口 行为 的 信息 。 

4) 包含 地 址 译 码 电路 以 确定 何 时 被 处 理 器 寻 址 。 

5 ) 产生 所 需要 的 时 序 信号 。 

6 ) 执行 所 有 在 处 理 器 和 IO 设备 之 间 传 送 数据 所 需 的 格式 转换 ， 如 串 行 端口 下 的 并 / 串 
转换 。 


7.4.1 并 行 接口 


现在 我 们 用 几 个 例子 来 解释 一 下 接口 设计 的 主要 内 容 。 首 先 ， 描 述 一 下 用 于 连接 简单 输 
入 设备 ( 如 键盘 ) 的 8 位 输入 端口 的 接口 电路 。 然 后 我 们 再 描述 用 于 连接 输出 设备 ( 如 显示 
器 ) 的 8 位 输出 端口 的 接口 电路 。 假 定 这 些 接口 电路 是 连接 到 一 个 32 位 处 理 器 上 的 ， 该 处 理 
器 使 用 存储 器 映射 IO 寻 址 以 及 图 7-6 与 图 7-7 所 描述 的 异步 总 线 协议 。 

1， 输 入 接口 

图 7-10 显示 了 一 个 可 以 用 来 将 键盘 连接 到 处 理 器 的 电路 。 这 个 电路 中 的 寄存 器 对 应 于 
图 3-3 中 给 出 的 寄存 器 。 假 设 不 使 用 中 断 ， 那 也 就 不 需要 控制 寄存 器 。 因 此 只 需要 两 个 寄存 
器 ， 一 个 数据 寄存 器 KBD_ DATA 和 一 个 状态 寄存 器 KBD STATUS。 后 者 包含 有 键盘 状态 标 
志 KIN。 


输入 接口 


KBD_DATA 
EE 


KBD_STATUS 





图 7-10 键盘 与 处 理 器 的 连接 


一 般 的 键盘 由 机 械 开 关 组 成 ， 这 些 开 关 通 常 是 断 开 的 。 当 一 个 键 被 按 下 时 ， 它 的 开关 闭 
合 形成 一 条 电信 号 通路 。 该 信号 可 以 被 编码 器 电路 检测 到 然后 产生 相应 字符 的 ASCII 码 。 这 
种 机 械 按钮 开关 的 一 个 难点 是 当 一 个 键 被 按 下 后 的 接触 反弹 (bounce )， 这 会 导致 开关 稳定 在 
闭合 位 置 之 前 电气 连接 的 多 次 形成 与 断 开 。 即 使 反弹 只 持续 1 ~ 2 毫秒 ， 这 也 足以 使 计算 机 将 
一 次 按键 行为 错误 地 解释 为 按 下 和 松 开 了 多 次 。 可 以 使 用 一 个 简单 的 消除 反弹 的 电路 来 消除 反 
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弹 的 副作用 ， 该 电路 可 以 是 键盘 硬件 的 一 部 分 ， 也 可 以 合并 到 编码 器 电路 中 。 另 外 ， 开 关 反 弹 
也 可 以 用 软件 来 处 理 。 软 件 检测 到 键盘 状态 标志 KIN 被 设置 为 1 时 就 表明 有 某 个 键 被 按 下 。 
然后 IO 程序 在 读 取 输入 缓冲 区 KBD_DATA 的 内 容 之 前 可 以 引入 足 够 长 的 延 时 来 确保 反弹 
已 经 结束 。 当 采用 硬件 来 消除 反弹 时 ，LO 程序 在 检测 到 KIN 等 于 1 的 时 候 就 可 以 读 取 输 入 
字符 了 。 

图 7-10 中 编码 器 的 输出 由 表示 编码 字符 的 一 个 字 节 数据 和 一 个 有 效 ( Valid ) 控制 信号 组 
成 。 当 一 个 键 被 按 下 时 ， 有 效 信号 从 0 变 为 1， 并 将 相应 字符 的 ASCII 码 装 人 KBD DATA 寄 
存 器 ， 同 时 将 状态 标志 KIN 置 1。 处 理 器 读 取 KBD_DATA 寄存 器 的 内 容 后 将 状态 标志 清 0。 
所 示 的 接口 电路 与 一 条 异步 总 线 相 连 ， 该 总 线 使 用 图 7-6 的 握手 信号 “ 主 控 就 绪 ” 和 “从 动 就 
绪 ” 控 制 传输 。 此 外 该 总 线 还 有 另外 一 根 控 制 线 RMW， 它 等 于 1 时 表示 读 操 作 。 

图 7-11 展示 了 一 个 输入 接口 电路 。 接 口中 有 两 个 可 寻 址 的 单元 ，KBD DATA 和 KBD 
STATUS。 它 们 在 地 址 空间 中 占用 相 邻 的 字 单 元 ， 如 图 3-3 所 示 。 实 际 上 状态 寄存 器 中 只 有 bl 
这 一 位 包含 有 用 的 信息 ， 也 就 是 键盘 状态 标志 KIN。 当 处 理 器 读 取 状 态 寄 存 器 时 ， 其 他 的 位 都 
被 认为 是 0。 


KBD_DATA 








多 路 复 用 器 
| 问 
DO < 
LR | 
启用 
KBD_STATUS 
一 一 人 一、 
| i | | 
Wo 0 00 KIN 
县 = 
主 控 就 绪 站 
R/W 人 
A31 量 
地 址 = 
译 码 器 


A3 


A2 
图 7-11 输入 接口 电路 
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当 处 理 器 请 求 一 个 读 操 作 时 ， 处 理 器 将 相应 寄存 器 的 地 址 放置 到 总 线 的 地 址 线 上 。 当 
KBD_DATA 和 KBD_STATUS 这 两 个 寄存 器 其 中 一 个 正在 被 寻 址 时 ， 接 口 电 路 中 的 地 址 译 码 
器 会 检查 Ai 3 位 ， 并 发 出 其 输出 My-address。A; 位 决定 两 个 寄存 器 的 哪 一 个 参与 到 过 程 中 
来 。 因 此 ， 可 以 使 用 一 个 多 路 复 用 器 来 根据 地 址 位 A; 选择 连接 到 总 线 上 的 寄存 器 。 两 个 最 低 
有 效 地 址 位 A 和 Ao 并 没有 使 用 ， 因 为 我 们 已 经 假设 所 有 地 址 都 是 字 对 章 的 。 

多 路 复 用 器 的 输出 通过 一 组 三 态 门 连接 到 总 线 的 数据 线 上 。 只 有 当主 控 就 绪 、My-address 
和 R/W 这 三 个 信号 都 等 于 1 时 接口 电路 才 会 将 三 态 门 打开 ， 以 表示 读 操 作 。 从 动 就 绪 信 号 也 
同时 被 启用 ， 以 通知 处 理 器 所 请 求 的 数据 或 者 状态 信息 已 经 被 放置 在 数据 线 上 了 。 当 地 址 位 
A 等 于 0 时 ， 读 取 数 据 ( Read-data ) 信号 也 被 启用 ， 这 个 信号 用 来 重 置 KIN 标志 。 : 

图 7-12 给 出 了 状态 标志 电路 的 一 
种 可 行 实 现 方案 ，KIN 标志 是 所 连接 的 
NOR 锁 存 器 的 输出 ， 如 图 7-12 所 示 。 触 
发 器 将 被 “有 效 ” 信 号 线 上 的 上 升 沿 置 ” 主 控 就 结 
1。 这 将 改变 NOR 锁 存 器 的 状态 ， 从 而 将 
KIN 置 为 1， 但 这 仅仅 是 在 主 控 就 绪 信 和 号 
为 低 电 平时 才 会 发 生 。 该 附加 条 件 是 为 了 
确保 KIN 在 被 处 理 器 读 取 的 时 候 不 能 改 
变 锁 存 器 的 状态 。 当 “ 读 取 数据 ”信和 号 变 
为 1， 表 明 KBD_DATA 在 被 读 取 时 ， 触 图 7-12 图 7-11 中 状态 标志 模块 的 电路 
发 器 和 锁 存 器 都 被 重 置 成 0。 

图 7-11 和 图 7-12 所 示 的 电路 说 明了 接口 电路 需要 实现 的 各 种 功能 。 利 用 现代 计算 机 辅助 
设计 工具 的 设计 人 员 会 使 用 硬件 描述 语言 ( 如 VHDL 或 者 Verilog ) 来 详细 说 明 这 些 功能 。 设 
计 出 来 的 电路 可 能 会 因为 所 使 用 技术 的 不 同 而 与 这 两 幅 图 所 示 的 电路 有 所 不 同 。 

2. 输出 接口 

现在 让 我 们 再 来 看 一 下 图 7-13 所 示 的 输出 接口 ， 它 可 以 用 来 连接 一 个 输出 设备 ， 如 显示 
器 。 假 设 显示 器 使 用 两 个 握手 信号 : 新 数据 ( New-data ) 和 就 绪 ( Ready )， 使 用 方式 与 主 控 就 
绪 和 从 动 就 绪 两 个 总 线 信号 之 间 的 握手 方式 类 似 。 当 显示 器 准备 好 接收 一 个 字符 时 ， 它 就 启动 
它 的 “就 绪 ” 信 和 号， 这 使 得 DISP_STATUS 寄存 器 中 的 DOUT 标志 被 置 为 1。 当 IO 程序 检查 
到 DOUT 等 于 1 时 ， 它 就 发 送 一 个 字符 到 DISP_DATA。 这 将 会 把 DOUT 标志 清 为 0 并 把 “新 
数据 ”信和 号 置 为 1。 显示 器 进行 响应 ， 将 “就 绪 ” 信 和 号 设 为 0， 接收 并 显示 DISP_DATA 中 的 
字符 。 当 准备 好 接收 另 一 个 字符 时 ， 显 示 器 再 次 启动 “就 绪 ” 信 号， 并 重复 上 述 过 程 。 

输出 接口 


读 取 数据 





数据 





DISP_DATA 


DISP_STATUS 


图 7-13 显示 器 与 处 理 器 的 连接 
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图 7-14 显示 了 输出 接口 的 一 种 实现 。 该 接口 除了 对 读 和 写 操作 都 会 进行 响应 之 外 ， 它 
的 操作 与 图 7-11 中 输入 接口 的 类 似 。 当 A:=0 时 进行 写 操作 ， 将 一 个 字 节 的 数据 装 和 人 DISP_ 
DATA 寄存 器 中 。 当 A:=1 时 进行 读 操作 ， 读 取 状 态 寄存 器 DISP_STATUS 的 内 容 。 在 这 种 情 
况 下 ， 只 有 DOUT 标志 ， 也 就 是 状态 寄存 器 的 b; 位 会 被 接口 发 送 。DISP_STATUS 中 剩余 的 位 
都 不 会 被 使 用 。 状 态 标志 的 状态 由 握手 控制 电路 决定 。 本 章 最 后 的 例 7.4 给 出 了 描述 这 个 电路 
行为 的 状态 图 。 


DISP_DATA 





图 7-14 输出 接口 电路 


7.4.2 ”上 串 行 接口 

串 行 接口 用 于 连接 处 理 器 与 那些 每 次 只 传输 一 位 数据 的 IO 设备 。 数 据 在 设备 端 以 串 行 
位 的 形式 传输 ， 而 在 处 理 器 端 则 以 并 行 位 的 形式 传输 。 并 行 与 串 行 之 间 的 转换 由 移 位 寄存 器 
完成 ， 移 位 寄存 器 有 并 行 存 取 的 能 力 。 图 7-15 是 一 个 典型 的 串 行 接口 模块 图 。 输 入 移 位 寄 
存 器 接收 来 自 IO 设备 的 串 行 位 输入 。 当 8 位 数据 都 接收 完 后 ， 移 位 寄存 器 的 内 容 并 行 装 和 人 
DATAIN 寄存 器 中 。 相 似 地 ，DATAOUT 寄存 器 中 的 输出 数据 也 被 传输 到 输出 移 位 寄存 器 中 ， 
在 输出 移 位 寄存 器 中 数据 被 逐 位 移出 并 发 送 到 IO 设备 上 。 

这 种 接口 中 处 理 总 线 的 部 分 与 前 面 讲述 的 并 行 接口 相同 。 两 个 状态 标志 ， 我 们 将 其 称 为 
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SIN 和 SOUT， 由 状态 与 控制 模块 进行 管理 。 当 新 数据 从 移 位 寄存 器 装 和 人 DATAIN 后 SIN 标志 
被 置 为 1， 这 些 数据 被 处 理 器 读 取 后 SIN 标志 被 清 为 0。SOUT 标志 指出 DATAOUT 寄存 器 是 
否 可 用 ， 处 理 器 将 新 数据 写 人 DATAOUT 寄存 器 后 SOUT 被 置 为 0， 数 据 从 DATAOUT 寄存 
器 传送 到 输出 移 位 寄存 器 后 SOUT 被 置 为 1。 

图 7-15 中 输入 /输出 通路 中 使 用 的 双 缓 冲 非 常 重要 。 如 果 将 DATAIN 和 DATAOUT 本 身 
实现 为 移 位 寄存 器 的 话 ， 虽 然 不 再 需要 独立 的 移 位 寄存 器 ， 但 是 这 将 会 给 VO 设备 的 操作 带 来 
不 便 。 从 串 行 线 上 接收 一 个 字符 后 ， 接 口 只 有 等 到 处 理 器 读 取 了 DATATN 的 内 容 后 才能 够 开 
始 接收 下 一 个 字符 。 这 样 ， 两 个 字符 之 间 就 需要 一 个 间隔 以 使 处 理 器 有 时 间 来 读 取 输 入 数据 。 
使 用 双 缓 冲 技术 的 话 ， 第 二 个 字符 的 传送 在 第 一 个 字符 从 移 位 寄存 器 装 和 人 DATAIN 寄存 器 后 
就 可 以 开始 。 因 此 ， 如 果 处 理 器 在 第 二 个 字符 的 串 行 传输 完成 前 读 取 了 DATAIN 寄存 器 的 内 
容 ， 接 口 就 可 以 在 串 行 线 上 接收 连续 的 输入 数据 流 。 在 接口 的 输出 通路 中 也 存在 类 似 的 情况 。 











四 天 
A2 一 中 地 址 译 码 器 Ee 本 
R/W 和 控制 电路 输出 移 位 寄存 器 串 行 输 寺 
主 控 就 绪 
从 动 就 绪 


图 7-15 ” 串 行 接口 


在 串 行 传输 期 间 ， 接 收 器 需要 知道 什么 时 候 将 每 个 位 移 到 其 输入 移 位 寄存 器 中 。 因 为 没 
有 单独 的 线路 把 时 钟 信号 从 发 送 器 传送 到 接收 器 ， 所 以 必须 使 用 一 种 编码 方案 将 所 需 的 时 序 信 
息 嵌 入 到 所 传输 的 数据 中 。 有 两 种 基本 的 方法 。 第 一 种 方法 被 称 为 异步 传输 ， 因 为 接收 器 使 用 
的 时 钟 与 发 送 器 的 时 钟 不 同步 。 在 第 二 种 方法 中 ， 接 收 器 能 够 产生 一 个 与 发 送 器 时 钟 同 步 的 时 
钟 ， 因 此 这 种 方法 被 称 为 同步 传输 。 下 面 将 简要 描述 这 两 种 方法 。 

1. 异步 传输 

异步 传输 使 用 了 一 种 称 为 起 止 〈 start-stop ) 传输 的 技术 。 数 据 被 组 织 成 带 有 明确 定义 的 起 
点 和 终点 的 6 到 8 位 的 小 组 。 典 型 情况 下 , 用 8 位 编码 的 字符 按照 图 7-16 所 示 进 行 传输 。 连 
接 发 送 器 与 接收 器 的 线路 在 闲置 时 的 状态 为 1， 传 输 一 个 0 位 作为 起 始 位 ， 后 面 紧 接着 的 是 8 
个 数据 位 和 1 或 2 个 终止 位 ,终止 位 的 逻辑 值 为 1。 起 始 位 开始 处 的 1 到 0 跳 变 提醒 接收 器 数 
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据 传输 即将 开始 。 接 收 器 使 用 它 自己 的 时 钟 来 确定 下 一 个 8 位 数据 的 位 置 ， 并 将 这 8 位 数据 装 
入 它 的 输入 寄存 器 中 。 跟 在 所 传输 字符 之 后 的 终止 位 等 于 1， 确保 能 识别 出 下 一 个 字符 的 起 始 
位 。 当 传输 结束 时 ， 线 路 保持 1 状态 ， 直 到 另 一 个 字符 开始 传输 。 





汪 
8 个 数据 位 
1 或 2 个 
起 始 位 四 本 位 时 间 终止 位 f- 新 字符 的 


起 始 位 
图 7-16 异步 串 行 字 符 传输 


为 了 保证 接收 器 能 够 正确 地 接收 数据 ， 接 收 器 在 对 输入 数据 进行 采样 的 时 候 需 要 尽 可 能 
地 靠近 每 一 位 的 中 心 。 这 可 以 通过 使 用 一 个 频率 和 远 远 高 于 传输 时 钟 f 的 时 钟 信号 来 完成 。 
通常 ,所 = 16fr。 这 意味 着 每 一 个 数据 位 间隔 期 间 可 以 产生 16 个 本 地 时 钟 脉冲 。 这 个 时 钟 用 来 
使 一 个 模 16 的 计数 器 递增 ， 当 检测 到 起 始 位 的 前 沿 时 该 计数 器 被 清 0。 计 数值 为 8 时 就 达到 
了 起 始 位 的 中 间 位 置 。 这 时 ， 输 入 线 的 状态 再 次 被 采样 以 确认 它 是 一 个 有 效 的 起 始 位 (0 )， 同 
时 计数 器 被 清 0。 从 这 一 点 往 后 ， 每 当 计 数 达 到 16 就 对 输入 的 数据 信号 采样 一 次 ， 此 时 应 当 
接近 每 一 个 输入 位 的 中 间 位 置 。 因 此 ， 只 要 如 16 足够 接近 万， 接收 器 都 可 以 正确 加 载 输入 字 
符 中 的 每 一 位 。 

2.， 同步 传输 

上 面 描述 的 起 止 方式 中 ， 起 始 位 的 开始 有 一 个 1 到 0 的 跳 变 ， 如 图 7-16 所 示 ， 这 个 跳 变 
的 位 置 是 获取 正确 时 序 信息 的 关键 。 只 有 在 传输 速度 足够 低 以 及 图 中 所 示 的 方 波形 状 在 传输 链 
路 上 保持 不 变 的 情况 下 ， 这 种 方式 才 是 可 用 的 。 为 了 能 高 速 地 传输 数据 ， 接 收 器 需要 一 个 更 可 
靠 的 方法 来 恢复 时 序 信息 。 

在 同步 传输 中 ， 接 收 器 通过 检测 所 收 到 信号 中 连续 的 1 到 0 和 0 到 1 跳 变 来 产生 一 个 与 
发 送 器 时 钟 同步 的 时 钟 。 接 收 器 将 时 钟 工作 沿 的 位 置 调 整 到 位 位 置 的 中 心 。 有 很 多 的 编码 方式 
可 以 用 来 确保 发 生 足 够 的 信号 跳 变 以 使 得 接收 器 能 产生 一 个 同步 的 时 钟 并 能 保持 同步 。 一 旦 实 
现 同 步 ， 数 据 传输 就 可 以 无 限期 地 继续 下 去 。 编 码 数据 通常 是 以 块 为 单位 进行 传输 的 ， 每 一 块 
包括 几 百 到 几 千 比特 。 在 每 一 块 的 开始 和 结尾 都 使 用 了 适当 的 代码 来 标记 ， 块 内 的 数据 是 按照 
一 组 约定 的 规则 组 织 的 。 同 步 传输 能 实现 非常 高 的 数据 传输 率 。 


7.5 互 连 标准 


一 台 典 型 的 台式 机 或 笔记 本 电脑 拥有 多 个 端口 ， 这 些 端口 可 以 用 来 连接 鼠标 、 存 储 键 或 
磁盘 驱动 器 等 /O 设备 。 如 今 已 经 开发 出 一 些 标准 接口 ， 使 得 WO 设备 可 以 使 用 与 任何 特定 的 
处 理 器 无 关 的 接口 来 与 计算 机 连接 。 例 如 ， 一 个 具有 USB 连接 器 的 存储 键 可 以 用 在 任何 带 有 
USB 端口 的 计算 机 中 。 在 这 一 节 中 ， 我 们 将 简要 描述 一 些 广泛 使 用 的 互 连 标准 。 

大 部 分 标准 是 由 很 多 公司 共同 协作 开发 的 。 很 多 情况 下 ， 电 气 和 电子 工程 师 协会 (Institute 
of Electrical and Electronics Engineers，IEEE ) 会 进一步 开发 这 些 标准 并 将 它们 作为 IEEE 标准 
进行 发 布 。 
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7.5.1 通用 串 行 总 线 

通用 串 行 总 线 ( Universal Serial Bus，USB ) [1] 是 最 广泛 使 用 的 互 连 标准 。 很 多 设备 都 带 
有 一 个 USB 连接 器 ， 包 括 鼠 标 、 存 储 键 、 磁 盘 驱 动 器 、 打 印 机 、 摄 像 头 及 其 他 很 多 的 设备 。 
USB 在 商业 上 的 成 功 是 因为 它 的 简单 性 及 低 成 本 。 原 来 的 USB 规范 支持 低速 ( 1.5Mb/s ) 和 全 
速 (12Mb/s ) 这 两 种 速度 的 操作 。 后 来 ， 引入 了 称 为 高 速 USB 的 USB 2。 它 可 使 数据 传输 速 
度 高 达 480Mb/s。 当 LO 设备 继续 发 展 到 对 速度 有 了 更 高 的 要 求 时 就 开发 出 了 USB 3 ( 称 为 超 
高 速 )。 它 能 支持 高 达 5Gb/s 的 数据 传输 率 。 

USB 是 为 了 满足 如 下 几 个 主要 目标 而 设计 的 : 

e 提供 一 个 简单 、 廉 价 、 使 用 方便 的 互 连 系统 。 

e 能 够 满足 多 种 IO 设备 和 比特 率 ， 包 括 Internet 连接 和 音频 视频 应 用 。 

e 采用 “ 即 插 即 用 ”的 操作 模式 ， 使 用 户 操作 更 加 方便 。 

在 讨论 USB 的 技术 细节 之 前 ， 我 们 先 详细 阐述 一 下 这 些 设计 目标 。 

1. 设备 特性 

连接 到 计算 机 上 的 各 种 设备 其 功能 范围 非常 广泛 。 设 备 的 数据 传送 速度 、 容 量 和 时 序 限 
制 相差 都 非常 大 。 

在 键盘 上 ， 每 按 下 一 个 键 就 会 产生 一 个 字 节 的 数据 ， 而 且 随 时 都 可 能 发 生 。 这 些 数据 应 
该 迅速 地 传送 给 计算 机 。 因 为 按键 事件 不 与 计算 机 系统 中 的 任何 其 他 事件 同步 ， 所 以 键盘 产生 
的 数据 是 异步 (asynchronous ) 的 ， 并且 又 受 操作 人 员 速 度 的 限制 ， 所 以 产生 数据 的 速率 非常 
低 ， 大 概 为 10 byte/s， 少 于 100 bit/s。 

各 种 可 能 连接 到 计算 机 上 的 简单 设备 其 产生 数据 的 过 程 都 有 类 似 的 特性 一 一 低速 和 异步 。 
计算 机 鼠标 和 在 视频 游戏 中 使 用 的 一 些 控制 器 和 操纵 杆 就 是 很 好 的 例子 。 

现在 看 一 下 男 一 种 类 型 的 数据 源 。 许 多 计算 机 都 有 外 带 的 或 内 置 的 麦克 风 。 由 麦克 风 接 
收 到 的 声音 产生 了 一 个 模拟 电信 和 号， 该 信号 必须 被 转换 成 数字 形式 才能 被 计算 机 处 理 。 周 期 
性 地 对 模拟 信号 进行 采样 可 以 完成 这 个 转换 。 对 每 一 个 样本 ， 模 / 数 (AD ) 转换 器 产生 一 个 
n 位 的 数 表示 样本 的 量 级 。 位 的 数量 n 是 根据 表示 每 个 样本 所 需 的 精度 来 选择 的 。 后 来 ， 当 这 
些 数据 被 送 到 扬声器 时 ， 再 使 用 一 个 数 / 模 (D/A ) 转换 器 将 数字 信号 转换 为 原来 的 模拟 信号 。 
类 似 的 方法 也 可 以 用 来 处 理 来 自 摄像 头 的 视频 信息 。 

采样 过 程 将 产生 一 个 连续 的 数字 化 样本 流 ， 这 些 数字 化 样本 按 固定 的 时 间 间 隔 到 达 ， 与 
采样 时 钟 同步 。 这 种 数据 流 被 称 为 等 时 (isochronous ) 的 ， 指 的 是 连续 的 事件 被 相同 的 时 间 段 
隔 开 了 。 信 号 必须 以 足够 快 的 速度 进行 采样 ， 以 捕获 它 的 最 高 频率 。 一 般 来 说 ， 如 果 抽 样 频 
率 为 每 秒 s 个 样本 ， 采 样 过 程 捕捉 到 最 高 频率 就 是 2。 例 如， 用 8kHz 的 采样 频率 可 以 充分 捕 
捉 到 人 的 语音 信息 ， 这 将 记录 高 达 4kHz 频率 的 声音 信号 。 对 于 更 高 品质 的 声音 ， 如 在 音乐 系 
统 中 ， 需 要 使 用 更 高 的 采样 频率 。 数 字 声 音 的 一 种 标准 采样 频率 是 44.1kHz。 每 一 个 样本 用 4 
个 字 节 的 数据 表示 以 满足 高 品质 声音 再 现 所 需 的 较 大 音量 范围 ( 动态 范围 )。 这 将 产生 大 约 为 
1.4Mb/s 的 数据 传输 速率 -。 

在 处 理 采 样 的 声音 和 音乐 信号 时 ， 有 一 个 很 重要 的 要 求 就 是 在 采样 和 回放 过 程 中 保持 精 
确 的 时 序 。 高 度 的 抖动 (样本 时 序 的 变化 ) 是 不 允许 的 。 因 此 ， 计 算 机 和 音乐 系统 之 间 的 数据 
传送 机 制 必须 保持 一 致 的 样本 间 延 迟 。 和 否则 就 需要 引入 复杂 的 缓冲 和 重 定 序 电 路 。 另 一 方面 ， 
偶尔 的 错误 或 样本 丢失 是 可 以 接受 的 。 听 者 可 能 完全 注意 不 到 ， 或 者 只 产生 不 引 人 注 意 的 滴答 
声 。 并 不 需要 复杂 的 机 制 来 确保 完全 正确 的 数据 传输 。 

图 像 或 视频 数据 的 传输 也 有 相似 的 要 求 ， 但 要 求 更 高 的 数据 传输 率 。 为 了 保证 商用 电视 
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的 图 像 质量 ， 一 张 图 片 需要 用 160KB 来 表示 ， 并 且 每 秒 钟 发 送 30 帧 ， 再 加 上 控制 信息 ， 这 将 
产生 44Mb/s 的 总 比特 率 。 高 品质 的 图 像 ， 如 HDTV ( 高 清晰 度 电视 ) 会 要 求 更 高 的 传输 速率 。 

大 容量 存储 设备 如 磁盘 和 光盘 的 要 求 则 不 同 。 这 些 设 备 是 计算 机 存储 器 层次 结构 的 一 部 
分 ， 将 在 第 8 章 中 介绍 。 它 们 到 计算 机 的 连接 需要 至 少 40 或 50Mb/s 的 数据 传输 带宽 。 磁 盘 机 
械 装 置 中 机 械 部 件 的 运动 所 产生 的 延迟 大 约 为 1 毫秒 。 因 此 ， 向 计算 机 发 送 或 从 计算 机 中 接 
收 数据 时 产生 的 较 小 额外 延迟 可 以 忽略 ， 也 不 用 考虑 拌 动 。 但 是 传输 机 制 必须 保证 数据 的 正 
确 性 。 

2.， 即 插 即 用 

当 一 个 IO 设备 连接 到 一 台 计 算 机 上 时 ， 操 作 系 统 需 要 设备 的 一 些 信息 。 它 需要 知道 设备 
是 什么 类 型 的 ， 以 便于 它 能 使 用 合适 的 设备 驱动 程序 。 操 作 系 统 还 需要 知道 设备 接口 中 的 寄存 
器 地 址 以 便于 能 和 设备 接口 进行 通信 。USB 标准 定义 了 能 与 其 通信 的 USB 硬件 和 软件 。 它 的 
即 插 即 用 (plug-and-play ) 特性 指 的 是 一 台新 设备 连接 到 计算 机 上 时 ， 系 统 能 够 自动 检测 到 它 
的 存在 。 该 软件 可 以 确定 设备 的 种 类 、 如 何 与 它 通信 以 及 它 可 能 具有 的 任何 特殊 的 要 求 。 其 结 
果 是 ， 用 户 只 需 简 单 地 插入 USB 设备 ， 就 可 以 开始 使 用 它 ， 而 不 必 参 与 其 中 任何 细节 。 

USB 也 是 可 热 插 拔 的 ， 这 指 的 是 在 电源 开启 的 情况 下 设备 可 以 插入 USB 端口 或 者 从 USB 
端口 移 除 。 

3. USB 体系 结构 

USB 使 用 了 点 对 点 的 连接 以 及 串 行 传输 格式 。 当 多 个 设备 被 连接 起 来 的 时 候 ， 它 们 被 组 
织 成 图 7-17 所 示 的 树 形 结构 。 树 的 每 个 结 点 都 有 一 个 称 为 集线器 (hub ) 的 设备 ， 它 是 主 计算 
机 与 IO 设备 之 间 的 中 间 传 输 点 。 在 树 的 根部 有 一 个 根 集 线 器 ( root hub ) 将 整 棵 树 连 接 到 主 
计算 机 上 。 树 的 叶子 是 IO 设备 ， 如 鼠标 、 键 盘 、 打 印 机 、Internet 连接 器 、 摄 像 头 或 扬声器 。 
树 形 结构 使 得 它 可 以 使 用 简单 的 点 到 点 串 行 链接 来 连接 许多 设备 。 





图 7-17 通用 串 行 总 线 (USB ) 的 树 形 结构 
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如 果 IO 设备 可 以 在 任何 时 候 发 送 消息 ， 那 么 两 条 消息 可 能 在 同一 时 间 到 达 集 线 器 并 相互 
干扰 。 因 为 这 个 原因 ，USB 的 操作 是 严格 基于 轮 询 法 的 。 设 备 只 有 在 响应 主 处 理 器 的 轮 询 时 
才 发 送 消息 。 因 此 ， 没 有 两 台 设备 可 以 同时 发 送 消 息 。 这 个 限制 使 得 我 们 可 以 采用 非常 简单 和 
廉价 的 集线器 。 

USB 上 的 每 一 台 设 备 ， 不 管 是 集线器 还 是 10 设备 ， 都 分 配 有 一 个 7 位 的 地 址 。 这 个 地 
址 是 USB 树 的 局 部 地 址 ， 并 且 与 处 理 器 的 地 址 空间 没有 任何 关系 。 连 接 到 处 理 器 上 的 USB 的 
根 集线器 看 起 来 就 像 是 一 台 单 一 的 设备 一 样 。 主 机 软件 通过 将 信息 发 送 到 根 集线器 来 与 单个 设 
备 进行 通信 ， 根 集线器 再 将 信息 转发 给 USB 树 中 的 适当 设备 。 

当 一 台 设 备 第 一 次 连接 到 集线器 上 或 被 启动 时 ， 它 的 地 址 为 0。 主 机 周期 性 地 轮 询 每 一 个 
集线器 来 收集 状态 信息 ， 了 解 是 否 有 新 增加 或 删除 的 设备 。 当 主机 得 知 一 台新 设备 已 连接 后 ， 
它 便 从 设备 USB 接口 的 一 个 特殊 存储 器 中 读 取 信息 以 了 解 该 设备 的 功能 ， 然 后 为 该 设备 分 配 
一 个 唯一 的 USB 地 址 并 把 这 个 地 址 写 到 设备 的 某 个 接口 寄存 器 中 。 这 就 是 使 USB 设备 具备 即 
插 即 用 功能 的 初始 连接 过 程 。 

4. USB 上 的 等 时 传输 

USB 的 一 个 主要 特性 是 它 能 够 支持 以 简单 的 方式 传输 等 时 数据 。 正 如 前 面 所 提 到 的 ， 等 
时 数据 需要 在 精确 定时 的 固定 时 间 间 隔 内 传输 。 为 了 适应 这 种 类 型 的 传输 ， 根 集线器 每 毫秒 在 
USB 树 内 发 送 一 个 唯一 可 识别 的 位 序列 。 这 个 位 序列 被 称 为 起 始 帧 字符 ， 用 来 标识 该 字符 之 
后 所 传输 的 等 时 数据 的 开始 。 因 此 数字 化 的 音频 和 视频 信号 可 以 用 一 种 定期 而 精确 定时 的 方式 
进行 传输 。 

5. 电气 特性 

USB 连接 由 4 根 电 线 组 成 ， 其 中 两 根 用 来 连接 电源 +5V 和 地 ， 另 外 两 根 用 于 传输 数据 。 
因此 ， 对 电源 需求 不 大 的 IO 设备 可 以 直接 从 USB 获得 能 源 ， 这 消除 了 像 存储 键 和 鼠标 这 样 
的 简单 设备 对 独立 电源 的 需要 。 

在 USB 电缆 中 发 送 数据 可 以 使 用 两 种 方法 。 在 低速 发 送 数据 时 ， 相 对 于 地 线 而 言 的 高 电 
压 在 两 根 数据 线 中 的 一 根 上 传输 时 表示 发 送 0， 在 另 一 根 上 传输 时 表示 发 送 1。 在 两 种 情况 中 
地 线 都 传送 返回 电流 。 这 种 在 相对 于 地 线 的 线路 上 传输 信和 号 的 方法 被 称 为 单 端 (single-ended ) 
传输 模式 。 

数据 在 任何 电缆 中 的 传输 速度 都 受到 电 噪 声 数 量 的 限制 。 噪 声 (noise ) 是 指 任何 干扰 所 
需 的 数据 信号 从 而 可 能 会 导致 错误 的 信号 。 单 端 传输 模式 很 容易 受到 噪声 的 影响 。 地 线 上 的 电 
压 对 于 连接 到 计算 机 上 的 所 有 设备 来 说 是 共同 的 。 一 个 设备 发 送 的 信号 可 能 引起 地 线 电压 的 微 
小 波动 ， 因 此 会 干扰 其 他 设备 发 送 的 信号 。 某 根 线 受 邻 近 线 上 噪声 的 影响 也 可 能 会 产生 干扰 。 

高 速 USB 使 用 了 另 一 种 被 称 为 差分 信号 ( differential signaling ) 的 方法 。 数 据 信号 在 绞 在 
一 起 的 两 根 数据 线 ( 即 双 绞 线 ) 上 传输 。 地 线 不 参与 传输 过 程 。 接 收 器 不 参考 地 线 ， 直 接 感 知 
两 根 信号 线 间 的 电压 差 。 这 种 方法 对 于 消除 接收 器 所 收 到 的 噪声 是 非常 有 效 的 ， 因 为 任何 输入 
到 双 绞 线 中 某 一 根 线 上 的 噪声 也 会 同时 输入 到 另外 一 根 线 上 。 由 于 接收 器 只 对 两 根 线 之 间 的 
电压 差 敏 感 ， 所 以 噪音 成 分 也 就 被 消除 了 。 地 线 扮演 了 屏障 的 角色 ， 防 止 双 绞 线 上 的 数据 受 
到 邻近 线路 的 干扰 。 与 单 端 信号 法 相 比 ， 差 分 信号 法 可 以 使 用 更 低 的 电压 和 更 高 的 速度 进行 
数据 传输 。 


7.5.2 ”火线 
火线 是 另 一 种 流行 的 互 连 标 准 。 它 最 初 是 由 苹果 公司 开发 的 ， 现 在 已 被 采纳 为 [EEE1394 
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标准 [2]。 像 USB 一 样 ， 它 使 用 了 差分 点 对 点 串 行 连接 。 下 面 是 火线 与 USB 之 间 显 著 的 不 
同 点 : 

e 火线 总 线 上 的 设备 被 组 织 成 菊花 链 的 形式 ， 而 不 是 USB 的 树 形 结构 。 第 一 个 设备 连接 
到 计算 机 上 ， 第 二 个 设备 连接 到 第 一 个 设备 上 ， 第 三 个 设备 连接 到 第 二 个 设备 上 ， 以 
此 类 推 。 

e 火线 适用 于 连接 音频 和 视频 设备 。 它 可 以 运行 在 等 时 模式 下 ， 该 模式 被 高 度 优化 以 实 
现 高 速 等 时 传输 。 

e 连接 到 USB 的 IO 设备 与 主 计算 机 进行 通信 。 如 果 数 据 从 一 个 设备 传输 到 另 一 个 设 
备 ， 例 如 从 摄像 头 传输 到 显示 器 或 打印 机 ， 则 数据 首先 被 主 计算 机 读 取 然后 再 将 其 发 
到 显示 带 或 打印 机 上 。 而 火线 则 不 同 ， 它 支持 一 种 点 对 点 ( peer-to-peer ) 的 操作 模 
式 。 这 指 的 是 数据 可 以 从 一 个 VO 设备 直接 传输 到 另 一 个 IO 设备 ， 而 不 需要 主 计算 
机 的 参与 。 

e 基本 的 火线 连接 器 有 6 个 引 脚 。 有 两 对 数据 线 ， 其 中 一 对 用 于 在 每 个 方向 上 传输 数据 ， 
另 一 对 用 于 电源 和 接地 。 高 速 版 本 的 火线 使 用 9 个 引 脚 的 连接 器 ， 增 加 了 三 根 地 线 来 
屏蔽 对 数据 线 的 干扰 。 

e 火线 总 线 可 以 提供 比 USB 更 大 的 功率 。 因 此 它 可 以 支持 中 等 功率 要 求 的 设备 。 

火线 被 广泛 应 用 于 音频 和 视频 设备 中 。 例 如 ， 大 多 数 摄像 机 有 一 个 火线 端口 。 现 有 的 几 

个 版 本 的 火线 标准 中 ， 其 工作 的 速度 范围 从 400Mb/s 到 3.6Gbys。 


7.5.3 PCI 总 线 


PCI (外围 部 件 互 连 ，Peripheral Component Interconnect ) 总 线 [3] 是 一 种 廉价 的 且 独 立 于 
处 理 器 的 总 线 。 它 位 于 计算 机 的 主板 上 ， 用 来 连接 各 种 设备 的 IO 接口 。 连 接 到 PCI 总 线 上 的 
设备 在 处 理 器 看 来 就 好 像 它 是 直接 连接 到 处 理 器 总 线 上 的 一 样 。 它 的 接口 寄存 器 在 处 理 器 的 地 
址 空间 内 分 配 地 址 。 

我 们 将 首先 描述 PCI 总 线 如 何 工作 ， 然 后 再 讨论 PCI 总 线 的 一 些 特性 。 

1.， 总线 结构 

图 7-18 说 明了 PCI 总线 在 计 
算 机 系统 中 的 使 用 。PCI 总 线 通 过 
一 个 被 称 为 桥 的 控制 器 连接 到 处 理 
器 总 线 上 。 桥 有 一 个 特殊 的 端口 用 
来 连接 计算 机 的 主 存储 器 。 它 还 可 
能 有 男 外 一 个 特殊 的 高 速 端口 用 来 
连接 图 形 设 备 。 桥 将 一 条 总 线 上 的 
命令 和 应 答 进行 翻译 并 转发 到 另 一 
条 总 线 上 ， 并 在 两 条 总 线 之 间 传 输 
数据 。 例 如 ， 当 处 理 器 发 送 一 个 读 
请 求 给 一 个 IO 设备 时 ， 桥 将 命令 
和 地 址 转发 给 PCI 总 线 。 当 桥接 收 
到 设备 的 应 答 时 ， 它 再 使 用 处 理 器 图 7-18 ”PCI 总 线 在 计算 机 系统 中 的 使 用 
总 线 将 数据 转发 给 处 理 器 。L/O 设备 可 能 通过 使 用 以 太 网 、USB、SATA 、SCSI 或 SAS 等 标准 
的 端口 连接 到 PCI 总 线 上 。 
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PCI 总 线 支持 三 个 独立 的 地 址 空间 : 存储 器 、I/O 和 配置 。 即 使 处 理 器 有 独立 的 VO 地 址 
空间 可 用 ， 系 统 设计 者 也 可 能 会 选用 存储 器 映射 IO 方式 。 实 际 上 ，PCI 标准 就 是 建议 使 用 这 
种 方法 以 获得 更 广泛 的 兼容 性 。 配 置 空间 是 用 来 支持 PCI 即 插 即 用 功能 的 ， 稍 后 我 们 将 简要 说 
明 。 随 同 地 址 一 起 发 送 的 一 个 4 位 命令 将 指明 在 特定 的 数据 传输 操作 中 使 用 的 是 三 个 地 址 空间 
中 的 哪 一 个 。 

计算 机 总 线 上 的 数据 传输 往往 以 数据 块 的 形式 操作 ， 而 不 是 单个 的 字 。 存 储 在 连续 存储 
单元 中 的 字 在 存储 器 和 IO 设备 ( 如 磁盘 或 以 太 网 连接 ) 之 间 直 接 传输 。 数 据 传输 由 LO 设备 
的 接口 作为 总 线 主 控 设备 发 起 。 这 种 直接 在 存储 器 与 IO 设备 之 间 传 输 数 据 的 方法 将 在 第 8 章 
中 进行 详细 的 讨论 。PCI 总 线 设 计 的 主要 目的 是 支持 多 字 传 输 。 单 个 字 的 读 或 写 操作 被 简单 地 
视 为 长 度 为 1 的 块 操作 。 

PCI 总 线 上 的 信号 约定 类 似 于 图 7-5 中 使 用 的 方式 , 但 有 一 个 重要 的 区 别 。PCI 总 线 使 用 
同一 线路 来 传输 地 址 与 数据 。 在 图 7-5 中 ， 我 们 假设 主 控 设 备 将 在 总 线 上 保持 地 址 信息 直到 数 
据 传输 结束 。 但 这 并 不 是 必须 的 。 地 址 信息 只 需 保 持 到 从 动 设备 被 选 定 就 足够 了 了 ， 然 后 就 可 以 
释放 线路 ， 以 便于 它 在 后 续 的 时 钟 周期 中 发 送 数据 。 在 多 个 字 的 传输 中 ， 从 动 设备 可 以 将 地 址 
存储 在 一 个 内 部 寄存 器 中 ， 并 递增 它 以 访问 连续 的 地 址 单元 。 这 种 方式 可 以 显著 降低 成 本 ， 因 
为 总 线 的 线路 数量 是 影响 计算 机 系统 成 本 的 一 个 重要 因素 。 

2.， 数 据 传送 

为 理解 PCI 总 线 的 操作 和 它 的 各 种 特性 ， 下 面 我 们 将 分 析 一 个 典型 的 总 线 事务 。 总 线 
主 控 设备 ， 也 就 是 通过 发 出 读 写 命令 来 启动 数据 传输 的 设备 ， 在 PCI 术语 中 被 称 为 启动 设备 
(initiator )。 响 应 这 些 命令 的 被 寻 址 的 设备 被 称 为 目标 设备 (target )。 表 7-1 中 列 出 了 用 于 传输 
数据 的 主要 的 总 线 信 号 。 有 32 或 64 根 线 使 用 与 图 7-5 中 类 似 的 同步 信号 方法 来 传输 地 址 和 数 
据 。 目 标 就 绪 信号 TRDY# 相当 于 图 7-5 中 的 从 动 就 绪 信 号 。 男 外 ，PCI 总 线 还 使 用 了 启动 就 
绪 信 号 IRDY# 来 支持 块 传输 。 我 们 将 简要 介绍 这 些 信 号 ， 以 让 读者 了 解 总 线 的 主要 特点 。 

PCI 总 线 上 一 次 完整 的 传送 操作 ， 包 括 一 个 地 址 和 一 块 数据 ， 被 称 为 事务 ( transaction )。 
让 我 们 来 看 一 个 启动 设备 从 存储 器 中 读 取 4 个 连续 的 32 位 字 的 总 线 事 务 。 图 7-19 显示 了 总 线 
上 的 事件 顺序 。 所 有 信号 的 跳 变 都 由 时 钟 的 上 升 沿 触发 。 与 图 7-5 一 样 ， 通 过 显示 信号 在 这 个 
时 钟 周 期 中 稍 后 才 发 生变 化 来 表示 它们 遇 到 的 延迟 - 名 字 以 # 结尾 的 信号 表示 低 电 平 有 效 。 

表 7-1 PCI 总 线 上 的 数据 传送 信号 


名 称 功 能 
CLK 33MHz 或 66MHz 的 时 钟 
FRAME# 由 启动 设备 发 送 以 指示 传输 的 持续 时 间 
AD 32 位 地 址 /数据 线 ， 可 以 增加 到 64 位 
C/BE# 4 位 命令 / 字 节 允许 线 ( 64 位 总 线 时 为 8 位 ) 
IRDY#, TRDY# 启动 就 绪 和 目标 就 绪 信和 号 
DEVSEL# 来 自 设备 的 响应 ， 表 示 它 已 经 识别 了 地 址 并 准备 好 了 数据 传送 事务 
IDSEL# 初始 化 设备 选择 


在 时 钟 周 期 1， 总 线 主 控 设备 作为 启动 设备 启动 信号 FRAME# 表示 事务 开始 。 同 时 ， 它 
将 地 址 发 送 到 AD 线 上 ， 将 命令 发 送 到 C/BE# 线 上 。 在 本 例 中 ,命令 指明 了 这 是 一 次 读 操作 
请 求 并 有 旦 使 用 的 是 存储 器 地 址 空间 。 

在 时 钟 周期 2， 启动 设备 撤销 地 址 信号 ， 将 它 的 驱动 器 从 AD 线 上 汤 开 ， 并 启动 信号 
IRDY# 来 表示 它 已 准备 好 接收 数据 。 被 选 定 的 目标 设备 启动 信号 DEVSEL# 来 表示 它 已 经 辨识 
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出 它 的 地 址 并 准备 好 做 回应 了 。 同 时 ， 被 选 定 的 目标 设备 将 它 的 驱动 器 连接 到 AD 线 上 ， 以 便 
ed | 名 | 要] 委 |] 3 委 ] | 
启动 设备 。 时 钟 周期 2 用 来 满足 : 

启动 设备 关闭 其 驱动 器 而 目标 设备 ce 
启用 它 的 驱动 器 时 ， 转 换 AD 线 的 FRAME# 
延迟 。 目 标 设备 在 时 钟 周 期 3 启动 
TRDY# 信号 并 开始 发 送 数据 。 它 将 
保持 DEVSEL# 信和 号 直到 事务 结束 。 C/BE# 

我 们 已 经 假定 目标 设备 在 时 钟 
周期 3 已 经 准备 好 发 送 数据 了 。 如 。 DY# 
果 没 有 准备 好 ， 目 标 设备 会 推迟 启 TRDY# 
动 TRDY# 信 号 直到 它 做 好 准备 。 
整个 数据 块 不 需要 在 连续 的 时 钟 周 DevSEl# 
期 中 发 送 。 启 动 设备 或 目标 设备 可 
能 会 通过 撤销 其 就 绪 信 和 号 来 引入 一 
个 暂停 ， 然 后 当 设备 准备 好 恢复 数据 传输 时 再 启动 就 绪 信和 号。 

C/BE# 线 在 时 钟 周期 1 用 来 发 送 总 线 命令 ， 在 其 余 周 期 中 用 作 其 他 目的 。 这 四 根 线 中 的 每 
一 根 都 与 AD 线 上 的 一 个 字 节 相 关联 。 启 动 设 备 启动 C/BE# 线 中 的 一 根 或 几 根 来 表示 哪 几 根 
字 节 线 将 被 用 来 传送 数据 - 

启动 设备 使 用 FRAME# 信号 表示 脉冲 的 持续 时 间 。 它 在 传送 倒数 第 2 个 字 时 撤销 这 个 信 
号 。 在 图 7-19 中 ， 启 动 设备 在 时 钟 周期 5， 也 就 是 在 它 接收 第 3 个 字 的 周期 撤销 FRAME# 信 
号 。 作 为 响应 ， 目 标 设 备 在 时 钟 周期 6 再 发 送 一 个 字符 ， 然 后 停 下 来 。 发 送 完 第 4 个 字 后 ， 目 
标 设备 撤销 TRDY# 和 DEVSEL# 信和 号， 并 将 它 的 驱动 器 与 AD 线 断 开 。 

3. 设备 配置 

将 一 台 IO 设备 连接 到 计算 机 上 时 ， 需 要 对 与 它 进行 通信 的 设备 接口 和 软件 进行 配置 操 
作 。 像 USB 一 样 ，PCI 也 具有 即 插 即 用 的 功能 ， 这 极 大 程度 地 简化 了 这 一 配置 过 程 。 事 实 上 ， 
即 插 即 用 这 个 特性 最 早 是 由 PCI 标准 引入 的 。PCI 接口 包括 一 个 较 小 的 配置 ROM 存储 器 来 保 
存 与 其 连接 的 设备 的 有 关 人 信息。 所 有 设备 的 配置 ROM 在 配置 地 址 空间 内 都 可 以 被 访问 ， 它 们 
在 系统 启动 或 复位 时 由 PCI 的 初始 化 软件 读 取 。 通 过 读 取 配置 ROM 中 的 信息 ， 初 始 化 软件 可 
以 确定 该 设备 是 打印 机 、 摄 像 头 、 以 太 网 接口 还 是 磁盘 控制 器 ， 还 可 以 得 知 各 种 设备 选项 和 特 
性 方面 的 信息 。 

连接 到 PCI 总 线 的 设备 并 没有 在 其 IO 接口 硬件 中 分 配 永久 的 地 址 。 相 反 的 ， 设 备 的 地 址 
是 在 初始 化 配置 过 程 中 由 软件 分 配 的 。 也 就 是 说 当 电源 接 通 时 ， 不 能 以 通常 的 方式 使 用 它们 
的 地 址 来 访问 设备 ， 因 为 还 没有 给 它们 分 配 任何 地 址 。 此 时 需要 使 用 另 一 种 不 同 的 机 制 来 选择 
IO 设备 。 

PCI 总 线 最 多 可 以 有 21 个 可 供 IO 设备 接口 卡 插入 的 连接 器 。 每 个 连接 器 都 有 一 个 被 称 
为 初始 化 设备 选择 ( IDSEL# ) 的 引 脚 。 这 个 引 脚 被 连接 到 高 位 的 21 根 地 址 /数据 线 AD11 到 
AD31 中 的 一 根 。 如 果 设 备 接口 的 IDSEL# 输入 端 被 启用 ， 那 么 它 会 响应 配置 命令 。 配 置 软件 
扫描 所 有 21 个 位 置 来 确定 LO 设备 接口 安装 在 哪里 。 对 于 每 一 个 位 置 ， 配 置 软件 使 用 一 个 地 
址 来 发 布 一 条 配置 命令 ， 在 这 个 地 址 中 对 应 于 那个 位 置 的 AD 线 被 置 为 1， 其 余 的 20 根 线 被 














图 7-19 ”PCI 总 线 上 的 一 次 读 操作 
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置 为 0。 如 果 某 个 设备 接口 产生 回应 ， 则 给 它 分 配 一 个 地 址 ， 并 将 这 个 地 址 写 人 它 为 此 目的 所 
指定 的 寄存 器 中 。 使 用 相同 的 编 址 机 制 ， 处 理 器 读 取 设 备 的 配置 ROM 并 进行 任何 必要 的 初始 
化 工作 。 它 使 用 低地 址 位 AD0 到 AD10 来 访问 配置 ROM 中 的 位 置 。 这 个 自动 化 的 过 程 意味 
着 使 用 者 只 需 插 上 接口 板 并 打开 电源 即 可 ， 其 余 的 工作 全 部 由 软件 来 完成 。 

PCI 总 线 已 经 非常 流行 ， 尤 其 是 在 PC 领域 。 它 也 用 在 许多 其 他 的 计算 机 中 ， 这 主要 得 益 
于 它 可 以 为 大 范围 的 1O 设备 提供 PCI 接口 。 现 在 有 32 位 和 64 位 两 种 配置 可 用 ， 它 们 分 别 使 
用 33MHz 或 者 66MHz 的 时 钟 。 一 种 称 为 PCI-X 的 高 性 能 版 本 也 投入 使 用 了 ， 它 是 以 133MHz 
时 钟 频率 运行 的 64 位 总 线 。 而 更 高 性 能 版 本 的 PCI-X 则 能 以 高 达 533MHz 的 时 钟 频率 运行 。 


7.5.4 SCSI 总 线 

缩写 SCSI 代表 小 型 计算 机 系统 接口 [4]。 它 是 由 美国 国家 标准 组 织 (ANSI ) 定义 的 一 种 
总 线 标准 。SCSI 总 线 可 以 用 来 将 各 种 设备 连接 到 计算 机 上 ， 而 它 特 别 适 合用 于 磁盘 驱动 器 。 我 
们 往往 可 以 在 使 用 了 很 多 磁盘 驱动 器 的 机 构 数据 库 或 电子 邮件 系统 中 发 现 SCSI 总 线 的 踪影 。 

在 最 初 的 SCSI 标准 规范 中 ， 设 备 通过 50 根 线 的 电缆 连接 到 计算 机 中 ， 电 缆 最 长 可 达 25 
米 ， 数 据 传 输 速率 最 高 可 达 5MB/s。SCSI 总 线 标准 经 历 了 多 次 修改 ， 它 的 数据 传输 能 力 增 长 
得 非常 快 。 已 经 定义 的 SCSI-2 和 SCSI-3 标准 每 一 种 都 有 好 几 个 选项 。 使 用 高 达 80MHz 的 时 
钟 频率 时 ， 数 据 可 以 并 行 传输 8 位 或 者 16 位 。 同 时 也 有 好 几 种 电信 号 方式 可 供 选 择 。SCSI 总 
线 可 以 使 用 单 端 传输 ， 此 时 每 一 个 信号 使 用 一 根 线 ， 所 有 信号 使 用 一 根 共 用 的 地 线 进行 返回 。 
在 另 一 种 选择 中 ,使 用 了 差分 信和 号， 每 个 信号 使 用 一 对 线路 。 

数据 传输 

连接 到 SCSI 总 线 的 设备 不 属于 处 理 器 地 址 空间 的 一 部 分 ， 这 与 连接 到 处 理 器 总 线 或 PCI 
总 线 的 设备 是 一 样 的 。SCSI 总 线 可 能 会 直接 连接 到 处 理 器 总 线 上 ， 但 更 有 可 能 通过 SCSI 控制 
器 连接 到 PCI 之 类 的 其 他 标准 IO 总 线 上 。 数 据 和 命令 会 以 多 字 节 数据 包 的 方式 进行 传输 。 为 
了 向 设备 发 送 命令 或 数据 ， 处 理 器 在 存储 器 中 组 装 信息 ， 然 后 指示 SCSI 控制 器 把 它 传送 给 设 
备 。 同 样 ， 当 从 设备 读 取 数 据 时 ，SCSI 控制 器 将 数据 传送 到 存储 器 中 ， 然 后 通过 中 断 的 方式 
通知 处 理 器 。. 

为 了 说 明 SCSI 总 线 的 操作 ， 我 们 来 看 一 下 它 是 如 何 与 磁盘 驱动 器 一 起 工作 的 。 与 磁盘 驱 
动 器 通信 跟 与 主 存 通信 在 本 质 上 是 完全 不 同 的 。 数 据 是 存储 在 磁盘 的 扇 区 (sector ) 中 的 ， 每 
个 扇 区 包括 几 百 个 字 节 。 当 一 个 数据 文件 被 写 入 磁盘 时 ， 它 并 不 总 是 存储 在 相 邻 的 扇 区 中 ， 因 
为 磁盘 中 一 些 扇 区 可 能 已 经 包含 了 先前 存储 的 数据 ， 还 有 一 些 可 能 有 缺陷 必须 忽略 。 所 以 ， 一 
次 读 或 写 请 求 访 问 的 可 能 是 几 个 不 相 邻 的 磁盘 鹿 区 。 由 于 磁盘 机 械 移动 的 限制 ， 在 到 达 第 一 个 
需要 传送 数据 的 扇 区 前 可 能 会 有 大 约 几 毫秒 的 较 长 延迟 ， 然 后 一 块 数据 被 高 速 传 送 。 接 着 又 会 
发 生 另 一 个 延迟 以 达到 下 一 个 扇 区 ， 再 传送 另 一 块 数据 。 一 次 读 或 写 请 求 可 能 包括 好 几 块 这 样 
的 数据 。SCSI 协议 有 助 于 这 种 操作 模式 的 实现 。 

我 们 分 析 一 个 完整 的 读 操作 例子 。 下 面 是 简化 的 高 级 描述 ， 忽 略 了 细节 与 信号 约定 。 假 
设 处 理 器 要 从 磁盘 驱动 器 读 取 一 块 数据 时 ， 这 些 数据 存储 在 两 个 不 相 邻 的 磁盘 记 区 中 。 处 理 器 
发 送 一 个 命令 给 SCSI 控制 器 ,将 发 生 如 下 事件 序列 : 

1 ) SCSI 控制 器 竞争 SCSI 总 线 的 控制 权 。 

2 ) 当 SCSI 控制 器 在 仲裁 过 程 中 获胜 后 ， 它 向 磁盘 控制 器 发 送 命令 ， 指 明 所 要 求 的 读 操作 。 

3 ) 磁盘 控制 器 不 能 马上 开始 传输 数据 。 它 必须 先 把 磁头 移动 到 所 需 的 扇 区 。 因 此 ， 它 发 
送 一 个 消息 给 SCSI 控制 器 ， 表 明 它 将 暂时 中 断 它 与 SCSI 控制 器 的 连接 。SCSI 总 线 现 在 是 空 
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闲 的， 可 以 被 其 他 的 设备 使 用 。 

4 ) 磁盘 控制 器 发 送 一 个 命令 给 磁盘 驱动 器 ， 移 动 磁头 到 读 操作 中 的 第 一 个 扇 区 。 然 后 ， 
读 取 存储 在 扇 区 里 的 数据 并 保存 到 数据 缓冲 区 中 。 当 准备 好 开始 传送 数据 时 ， 磁 盘 控 制 器 请 求 
总 线 控制 权 。 仲 裁 获 胜 后 ， 它 重新 建立 与 SCSI 控制 器 的 连接 ， 传 送 数据 缓冲 区 中 的 内 容 ， 然 
后 再 次 中 断 连接 。 

5 ) 重复 这 个 过 程 ， 读 取 并 传输 第 二 个 磁盘 扇 区 的 内 容 。 

6 ) SCSI 控制 器 将 所 请 求 的 数据 传输 到 主 存储 器 中 ， 并 发 送 一 个 中 断 给 处 理 句 表示 数据 现 
在 是 可 用 的 。 

这 一 过 程 表明 SCSI 总 线 上 交换 的 消息 要 比 处 理 器 总 线 上 交换 的 消息 更 高 级 一 些 。 消 息 指 
的 是 可 能 需要 好 几 步 才能 完成 的 更 复杂 的 操作 ， 这 取决 于 具体 的 设备 。 处 理 器 和 SCSI 控制 器 
都 不 需要 了 解 磁盘 操作 的 细节 ， 也 不 需要 知道 它 是 如 何 从 一 个 扇 区 移动 到 另 一 个 扁 区 的 。 

SCSI 总 线 标准 定义 了 大 量 的 控制 消息 ， 这 些 消息 可 以 用 来 操作 不 同类 型 的 IO 设备。 还 
定义 了 用 来 处 理 在 设备 操作 或 数据 传送 期 间 可 能 发 生 的 各 种 错误 或 故障 情况 的 消息 。 


7.5.5 SATA 


在 个 人 计算 机 的 早期 日 子 里 ,流行 的 IBM 计算 机 的 总 线 AT 成 为 一 个 行业 标准 ， 它 
是 基于 Intel 8080 微 处 理 器 总 线 的 。 它 被 命名 为 I SA， 是 工业 标准 体系 (Industry Standard 
Architecture ) 的 缩写 。 一 个 增强 版 本 ， 其 中 包括 了 用 来 支持 磁盘 驱动 器 的 基本 软件 定义 ， 后 来 
被 命名 为 ATA， 是 AT 附件 ( AT Attachment ) 总 线 的 缩写 。 这 种 体系 体系 结构 的 串 行 版 本 就 是 
人 们 熟知 的 SATA[5]， 如 今 已 经 广泛 应 用 在 磁盘 接口 中 。 像 所 有 标准 一 样 ， 现 在 已 经 开发 出 了 
几 个 版 本 的 SATA， 增 加 了 新 的 特性 并 提高 了 速度 。 原 始 的 并 行 版 本 已 经 被 重新 命名 为 PATA， 
但 是 在 新 设备 中 已 经 不 再 使 用 了 。 

基本 的 SATA 连接 器 有 7 个 引 脚 ， 连 接 了 两 对 双 绞 线 及 三 根 地 线 。 使 用 了 差分 传输 ， 时 
钟 频率 的 范围 从 1.5Gb/s 到 6Gb/s。 最 近 的 一 些 版 本 还 提供 了 等 时 传输 特性 以 支持 音频 和 视频 
设备 。 


7.5.6 SAS 


SAS 是 SCSI 总 线 的 串 行 实 现 ， 因 此 它 的 名 字 叫 做 串 行 连接 SCSI ( Serially Attached SCSI ) 
[6]。 主 要 用 于 连接 磁盘 和 CD、DVD 驱动 器 。 它 使 用 了 类 似 于 SATA 的 串 行 点 对 点 连接 。SAS 
连接 可 以 同时 在 两 个 方向 上 传输 数据 ， 最 高 速度 可 以 达到 12Gb/s。 在 软件 层面 上 ，SAS 与 
SCSI 完全 兼容 。 


7.5.7 PCI Express 


LO 互 连 的 需求 日 益 增 加 。 互 联网 连接 、 复 杂 的 图 形 设备 、 流 媒体 视频 及 高 清晰 度 电 视 是 
涉及 高 速 数据 传输 的 典型 应 用 实例 。PCI Express 互 连 标准 ( 通常 被 称 为 PCIe ) [7] 就 是 为 满足 
这 些 需求 而 开发 的 ， 且 随 着 新 应 用 的 引入 ， 又 不 可 避免 地 需要 进一步 提高 数据 传输 速率 。 

PCI Express 使 用 串 行 的 点 对 点 连接 ， 经 由 交换 器 相互 连接 形成 一 个 树 形 结构 ， 如 图 7-20 
所 示 。 树 的 根 节 点 称 为 根 联合 体 (Root complex )， 被 连接 到 处 理 器 总 线 上 。 根 联合 体 有 一 个 连 
接 主 存储 器 的 特殊 端口 。 从 根 联合 体 发 出 的 所 有 其 他 连接 都 是 连 到 VO 设备 上 的 串 行 连接 。 这 
其 中 的 某 些 连接 可 能 会 连 到 一 个 交换 器 上 以 扩展 出 更 多 的 串 行 分 支 ， 如 图 中 所 示 。 交 换 器 可 能 
还 会 连接 到 支持 其 他 标准 (如 PCI 或 USB ) 的 桥接 接口 上 。 例 如 ， 树 形 结构 的 一 个 分 支 可 能 
是 一 条 PCI 总 线 ， 以 利用 现 有 的 具有 PCI 接口 的 多 种 设备 。 


257 











258 
1 
259 





170 : 第 7 章 输入 /输出 组 织 结 构 















PCIe 到 PCI | 
PCIe 到 USB | 


图 7-20 ”PCI Express 连接 


基本 的 PCI Express 连接 包括 两 对 双 绞 线 ， 每 一 对 用 于 一 个 方向 上 的 数据 传输 。 数 据 在 每 
一 对 双 绞 线 上 以 2.5Gb/s 的 速度 传输 ， 并 使 用 7.5.1 节 中 所 描述 的 差分 信号 法 。 数 据 可 以 同时 
在 两 个 方向 上 传输 。 另 外 ， 因 为 在 PCI 或 SCSI 中 没有 共享 总 线 ， 所 以 连 到 不 同 设备 的 连接 可 
以 同时 传输 数据 。 此 外 ， 一 个 连接 在 每 个 方向 上 可 能 会 使 用 多 对 双 绞 线 。 每 个 方向 使 用 一 对 双 
绞 线 的 基本 结构 被 称 作 一 个 通道 (lane )， 也 被 称 为 X1 连接 。 一 个 连接 可 能 会 使 用 2、4、8 或 
16 个 通道 ， 分 别 被 称 为 X2 、X4、X8 或 者 X16 连接 。 

同步 传输 连接 上 的 接收 器 必须 与 发 送 器 的 时 钟 同步 ， 如 7.4.2 节 中 所 述 。 为 了 做 到 这 一 
点 ， 对 所 传输 的 数据 进行 编码 以 确保 0 到 1 和 1 到 0 的 跳 变 可 以 发 生 的 足够 频繁 。 在 PCIe 标 
准 中 ， 每 一 个 8 位 的 数据 用 10 位 进行 编码 。 插 人 到 数据 流 中 的 其 他 位 是 为 了 执行 各 种 控制 功 
能 ， 如 描述 地 址 和 数据 信息 。 在 添加 了 附加 位 后 ， 数 据 传输 率 为 2.5Gb/s 的 一 对 双 绞 线 实际 上 
每 秒 钟 只 传输 了 1.6Gb 或 者 200MB 的 有 效 信息 。 一 个 X16 连接 可 以 在 每 个 方向 上 以 3.2Gb/s 
的 速度 传输 数据 。 相 比 之 下 ， 一 个 工作 频率 为 64MHz 的 64 位 PCI 总 线 峰 值 时 的 总 数据 传输 
率 是 512MB/s。PCI Express 的 另外 一 个 优点 是 使 用 了 少量 的 线路 ， 因 而 成 本 较 低 。 

PCI Express 协议 与 PCI 协议 完全 兼容 。 例 如 ， 它 们 使 用 了 相同 的 初始 化 配置 过 程 。 因 此 ， 
一 台 使 用 PCI Express 的 计算 机 可 以 使 用 为 基于 PCI 总 线 的 系统 所 开发 的 操作 系统 及 应 用 软件 。 






图 形 设备 
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7.6 结束语 


本 章 从 硬件 的 角度 介绍 了 计算 机 的 WO 结构 。 以 连接 到 总 线 上 的 W/O 设备 为 例 ， 来 说 明 数 
据 传 输 的 同步 与 异步 方法 。 

由 于 人 们 对 高 速 的 数据 传输 、 低 廉 的 成 本 和 便利 的 功能 ( 如 即 插 即 用 ) 等 方面 的 需求 不 
断 地 增长 ， 输 入 /输出 设备 的 互连网 络 体系 结构 已 经 成 为 一 个 主要 的 发 展 领域 。 本 章 简 要 描述 
了 几 种 VO 标准 ， 并 阐明 了 用 于 实现 这 些 目 标的 方法 。 目 前 的 趋势 是 从 并 行 总 线 转 移 到 串 行 的 
点 对 点 连接 。 串 行 连接 成 本 较 低 并 且 可 以 高 速 地 传输 数据 。 


7.7 ”问题 解析 


本 节 将 介绍 一 些 可 能 要 求学 生 解决 的 典型 问题 ， 并 分 析 说 明 如 何 解决 这 样 的 问题 。 
例 7.1| 

问题 : 计算 机 的 VO 总 线 使 用 了 图 7-4 所 示 的 同步 协议 。 该 总 线 的 最 大 传播 延迟 为 4ns。 总 线 主 控 设 
备 将 地 址 放 到 地 址 线 上 需要 花费 1.5ns。 从 动 设备 需要 3ns 来 对 地 址 进行 译 码 ， 另 外 需要 最 长 Sns 的 时 间 
来 将 所 请 求 的 数据 放置 在 数据 线 上 。 连 接 到 总 线 上 的 输入 寄存 器 需要 的 最 小 准备 时 间 为 lns。 假 设 总 线 时 
钟 有 50% 的 占 空 比 ， 即 时 钟 的 高 相位 与 低 相 位 的 持续 时 间 相 等 。 请 问 该 总 线 最 大 的 时 钟 频率 是 多 少 ? 
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解答 : 时 钟 高 相位 的 最 小 时 间 等 于 地 址 到 达 从 动 设备 并 被 译 码 的 时 间 ， 也 就 是 1 .5+4+3= 8.5 ns。 
时 钟 低 相位 的 最 小 时 间 则 等 于 从 动 设 备 将 数据 放 到 总 线 上 的 时 间 加 上 主 控 设 备 把 数据 装 人 寄存 器 的 时 间 ， 
也 就 是 5+4+1=10ns。 因 此 ， 最 小 的 时 钟 周 期 为 2 x 10= 20ns， 可 以 得 出 最 大 的 时 钟 频率 为 SOMHz。 


问题 : 一 个 仲裁 者 接收 到 了 三 个 请 求 信号 R1、R2 和 R3， 并 产生 三 个 授权 信号 G1、G2 和 G3。 请 
求 信 号 R1 优先 级 最 高 ，R3 的 优先 级 最 低 。 图 7-9 给 出 了 这 个 仲裁 者 操作 的 例子 。 请 给 出 一 个 描述 该 仲 


裁 者 行为 的 状态 图 。 

解答 : 图 7-21 给 出 了 一 个 状态 图 。 其 
中 仲裁 者 从 空闲 状态 A 开始 。 当 一 个 或 多 
个 请 求 信 号 发 出 时 ， 仲 裁 者 会 移动 到 B、C、 
D 三 个 状态 中 的 某 一 个 ， 这 取决 于 哪 一 个 
活 牙 请 求 具有 最 高 的 优先 级 。 当 仲裁 者 进 
入 到 新 的 状态 时 ， 它 启动 相应 的 授权 信号 。 
仲裁 者 一 直 保 持 在 这 个 状态 中 ， 直 到 被 服 
务 的 设备 取消 其 请 求 ， 此 时 仲裁 者 返回 状 
态 A。 当 仲裁 者 返回 状态 A 的 时 候 ， 它 会 
对 当时 任何 活跃 的 请 求 作 出 响应 ,或 者 等 
待 一 个 新 的 请 求 信号 发 出 。 

问题 : 为 使 用 图 7-4 中 协议 的 同步 
总 线 设 计 一 个 输出 接口 电路 。 当 数据 被 写 
人 这 个 接口 电路 的 数据 寄存 器 时 ， 接 口 在 
“新 数据 ”( New-data ) 线 上 发 出 一 个 宽度 为 


lxx 





输入 : R1, R2, R3 
输出 : G1, G2, G3 


图 7-21 例 7.2 的 状态 图 


一 个 时 钟 周期 的 脉冲 。 这 个 脉冲 使 得 连接 到 该 接口 上 的 输出 设备 可 以 获知 新 数据 已 经 可 用 。 
解答 : 同步 总 线 电 路 中 的 所 有 事件 都 由 一 个 时 钟 信号 驱动 。 图 7-22 显示 了 一 种 可 能 的 接口 电路 。“ 写 


和 数据”( Write-data ) 信和 号 启用 数据 寄存 器 ， 
而 后 在 该 时 钟 周期 末尾 的 时 钟 边沿 将 数据 装 
人 该 数据 寄存 器 中 。 同 时 ,“ 新 数据 ”触发 器 
被 置 为 1。 该 触发 器 Q 输出 端的 反馈 连接 在 接 
下 来 的 时 钟 边沿 上 将 触发 器 清 0。 

问题 : 画 出 表示 图 7-14 中 握手 控制 电路 
行为 的 有 穷 状 态 机 (FSM ) 的 状态 图 。 

解答 : 图 7-23 给 出 了 一 个 状态 图 。 其 中 ， 
电路 从 状态 A 开 始 ， 此 时 显示 设备 已 准备 好 
接收 新 数据 。 因 此 , New-data =0, DOUT = 1。 
一 个 写 操作 会 使 得 “ 写 人 数据 ”( Write-data ) 
信和 号 变 为 1。 这 将 导致 状态 机 移动 到 状态 B， 
并 且 其 输出 变 成 10。 状 态 机 保持 在 状态 B 中 ， 
直到 “就 绪 ”( Ready ) 信号 变 为 0， 表示 显示 
设备 已 经 知道 新 数据 可 用 了 。 这 时 ， 状 态 机 
移动 到 状态 C， 等 待 显示 设备 再 次 做 好 准备 。 
如 果 “ 写 人 数据 ”信和 号 还 没有 变 为 0， 状态 机 
也 必须 等 待 该 信号 变 为 0。 
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图 7-22 例 7.3 的 同步 输出 接口 电路 
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图 7-23 例 7.4 的 状态 图 


习题 
[E] 7.1 一 旦 输入 数据 寄存 器 被 读 取 ， 接 口 电路 中 表示 新 数据 可 用 的 输入 状态 位 就 被 清除 。 为 什么 要 这 
么 做 ? 
[E] 7.2 某 计算 机 有 16 根 地 址 线 ，A1s-o。 如 果 分 配给 一 台 设 备 的 十 六 进 制 地 址 是 7CA4， 并 且 该 设备 的 地 
址 译 码 器 忽略 As 和 As 两 根 线 。 这 台 设 备 将 对 哪些 地 址 进行 响应 ? 
[M] 7.3 一 个 处 理 器 有 7 根 中 断 请 求 线 ,INTR1 到 INTR7。INTR7 的 优先 级 最 高 ， 而 INTR1 的 优先 级 最 低 。 
设计 一 个 优先 级 编码 电路 ， 使 其 可 以 产生 表示 最 高 优先 级 请 求 的 3 位 代码 。 
[M] 7.4 图 7-4 一 图 7-6 展示 了 在 主 控 设 备 与 从 动 设备 之 间 传 输 数据 的 三 种 协议 。 在 读 操作 期 间 ， 如 果 被 
寻 址 的 设备 因为 故障 而 没有 响应 ， 请 问 在 三 种 不 同 协议 下 会 发 生 什 么 情况 ? 这 将 会 导致 什么 问 
题 ? 有 什么 可 行 的 补救 措施 ? 
[E] 7.5 在 图 7-5 的 时 序 图 中 ， 处 理 器 在 总 线 上 保持 地 址 信号 ， 直 到 接收 到 设备 的 响应 信号 。 这 是 必需 的 
吗 ? 如 果 处 理 器 只 在 一 个 周期 内 发 送 地 址 ， 则 设备 端 需要 什么 附加 设施 ? 
[E] 7.6 当 处 理 器 与 IO 设备 之 间 的 距离 增加 时 ， 图 7-6 中 的 时 序 图 会 受到 什么 影响 ? 在 图 7-4 中 ， 如 何 
才能 适应 距离 的 增 大 ? 
[E] 7.7 有 一 条 同步 总 线 按照 图 7-5 中 的 时 序 图 工作 。 总 线 和 连接 到 总 线 上 的 接口 电路 有 如 下 的 参数 : 
总 线 驱动 延迟 2ns 
总 线 传播 延迟 5 到 10ns 
地 址 译 码 器 延迟 6ns 
提取 请 求 数据 的 时 间 0 到 25ns 
准备 时 间 1.5ns 
(a) 该 总 线 能 够 工作 的 最 大 时 钟 速度 是 多 少 ? 
(b ) 完成 一 次 输入 操作 需要 多 少 个 时 钟 周期 ? 
[M] 7.8 考虑 图 7-6 所 示 的 异步 总 线 协议 。 使 用 与 习题 7.7 相同 的 参数 ， 完 成 一 次 总 线 传输 的 最 小 和 最 大 
时 间 是 多 少 ? 假设 总 线 相位 偏 移 为 lns。 
[M] 7.9 图 7-6 中 的 异步 总 线 协议 使 用 了 完全 握手 协议 ， 其 中 主 控 设 备 在 “ 主 控 就 绪 ” 线 上 保持 一 个 启动 
信号， 直到 它 接 收 到 “从 动 就 绪 ” 信 号 ; 从 动 设 备 保持 “从 动 就 绪 ” 线 为 启动 状态 ， 直 到 “ 主 控 
就 绪 ” 信 和 号 变 为 无 效 ， 以 此 类 推 。 考 虑 另外 一 种 协议 ， 其 中 每 个 信号 是 一 个 固定 宽度 为 4ns 的 脉 
冲 。 设 备 只 在 脉冲 的 上 升 沿 做 出 动作 。 使 用 与 习题 7.7 相同 的 参数 ， 完 成 一 次 总 线 传输 需要 的 最 
小 和 最 大 时 间 是 多 少 ? 
[M] 7.10 在 图 7-9 所 描述 的 仲裁 者 协议 示例 中 ， 主 控 设 备 接收 到 总 线 授 权 信和 号 后 保持 它 的 请 求 线 为 启动 
状态 ， 直 到 它 准 备 放弃 总 线 的 控制 权 。 假 设 有 一 条 公共 的 线路 “忙碌 ”( Busy )， 它 由 当前 正在 
使 用 总 线 的 主 控 设备 启动 。 仲 裁 者 只 有 在 “忙碌 ”信号 未 被 启动 的 情况 下 才能 对 总 线 授权 。 一 
且 主 控 设 备 接收 到 授权 信号 ， 它 就 启动 “忙碌 ”信和 号 并 撤销 它 的 请 求 ， 作 为 回应 ， 仲 裁 者 也 撤 
销 授 权 信 和 号。 当主 控 设备 使 用 总 线 完成 工作 时 取消 “忙碌 ”信和 号。 请 为 这 种 操作 模式 画 一 个 与 


第 7 章 输入 /输出 组 织 结构 :+ 173 


图 7-9 类 似 的 时 序 图 。 

[M] 7.11 针对 习题 7.10 中 所 描述 的 操作 模式 ， 修 改 例 7.2 中 给 出 的 状态 图 。 

[D] 7.12 例 7.2 中 的 仲裁 者 控制 对 公共 资源 的 访问 。 它 不 允许 抢占 ， 也 就 是 说 如 果 一 个 高 优先 级 的 请 求 
在 一 个 已 获得 授权 的 低 优先 级 请 求 之 后 到 达 ， 则 它 必须 等 待 直 到 当前 正在 使 用 公共 资源 的 设备 
完成 操作 。 在 某 些 情况 下 ， 人 允许 抢占 会 更 加 合适 ， 以 便 能 更 快 地 为 高 优先 级 的 设备 提供 服务 。 
这 种 系统 中 的 设备 应 能 够 在 仲裁 者 的 要 求 下 停止 并 放弃 对 公共 资源 的 使 用 。 这 必须 在 一 个 安全 
的 方式 下 完成 。 正 在 使 用 该 资源 的 设备 必须 能 够 到 达 服 务 可 以 终止 的 安全 点 ， 然 后 设备 会 通知 
仲裁 者 它 已 经 停止 使 用 该 资源 。 

(a ) 给 出 对 该 信号 协议 的 一 个 修改 方案 ,使 得 正在 运行 的 服务 能 够 安全 地 终止 。 
(b ) 修改 仲裁 者 的 状态 图 ， 以 实现 改进 后 的 协议 。 

[E] 7.13 仲裁 者 控制 对 公共 资源 的 访问 。 它 使 用 轮转 优先 级 的 方法 来 对 R1 到 R4 线 上 的 请 求 进行 响应 。 
起 初 ，R1 的 优先 级 最 高 ，R4 的 优先 级 最 低 。 某 条 线路 上 的 请 求 获 得 服务 后 ， 那 条 线路 的 优先 
级 变 成 最 低 ， 而 序列 中 的 下 一 条 线路 则 获得 最 高 优先 级 。 举 例 来 说 ， 当 R2 被 服务 后 ， 优 先 级 
顺序 从 高 到 低 依次 为 R3、R4、R1、R2。 请 求 序 列 R3 、R1、R4、R2 的 授权 序列 是 什么 ?假设 
最 后 三 个 请 求 在 第 一 个 请 求 正 在 被 服务 的 时 候 到 达 。 

[E] 7.14 有 一 个 仲裁 者 使 用 了 习题 7.13 中 描述 的 优先 级 方法 。 如 果 一 个 设备 反复 请 求 服务 会 发 生 什 么 情 
况 ? 将 该 仲裁 者 的 行为 与 使 用 固定 优先 级 方法 的 仲裁 者 进行 比较 。 

[E] 7.15 给 出 能 识别 16 位 十 六 进 制 地 址 FA68 的 地 址 译 码 器 的 逻辑 表达 式 。 

[M] 7.16 一 家 工厂 使 用 几 个 传感器 来 监控 温度 、 压 力 和 其 他 因素 。 每 一 个 传感器 都 包含 一 个 开关 ， 当 相 
应 的 参数 超过 预先 设 定 的 限制 时 会 将 开关 移动 到 ON 的 位 置 。 需 要 8 个 这 种 类 型 的 传感器 连接 
到 一 台 16 位 计算 机 的 总 线 上 。 设 计 一 个 合适 的 接口 ， 使 得 8 个 开关 的 状态 可 以 作为 一 个 单独 的 
字 节 被 同时 读 取 。 假 设 总 线 是 同步 的 ， 并 使 用 图 7-4 中 的 时 序 。 

[E] 7.17 图 7-4 中 的 总 线 协 议 指定 了 从 动 设备 只 能 在 时 钟 的 第 二 个 相位 中 发 送 数据 。 

(a ) 有 可 能 某 个 设备 会 识别 出 它 的 地 址 并 准备 好 尽快 发 送 数 据 。 为 什么 设备 不 能 这 么 做 ?处 理 器 
是 否 会 接收 到 错误 的 数据 ? 
(b ) 是 否 还 会 发 生 其 他 的 问题 ? 

[M] 7.18 数据 存储 在 输入 接口 中 的 一 个 小 存储 器 中 ， 该 接口 连接 到 使 用 图 7-5 所 示 协 议 的 同步 总 线 上 。 
总 线 上 的 读 和 写 操作 由 命令 线 R/W 指示 。 从 存储 器 中 读 取 数据 需要 两 个 时 钟 周期 。 设 计 一 个 电 
路 以 生成 该 接口 的 从 动 就 绪 响应 信和 号 。 

[E] 7.19 图 7-19 中 PCI 协议 的 两 个 信号 DEVSEL# 和 TRDY# 各 自 代 表 一 个 来 自 启动 设备 的 响应 信和 号。 
这 两 个 信号 的 功能 有 何不 同 ? 

[E] 7.20 考虑 图 7-19 所 示 的 PCI 总 线 的 数据 传输 操作 。 如 果 目 标 设备 在 第 2 和 第 3 个 字 之 间 需 要 两 个 时 
钟 周期 的 延迟 ， 该 总 线 协议 将 如 何 处 理 这 种 情况 ? 

[E] 7.21 向 连接 到 PCI 总 线 上 的 一 个 输出 设备 传送 3 个 字 ， 请 画 出 该 操作 的 时 序 图 。 
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存储 如 系统 


本 章 目标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

。 基本 的 存储 器 电路 

e 主 存储 器 的 组 织 结构 

。 存储 器 技术 

。 一 种 VO 机 制 一 一 直接 存储 器 访问 

e 减少 有 效 存储 器 访问 时 间 的 高 速 缓存 

。 增加 主 存储 器 表现 容量 的 虚拟 存储 器 

e 用 于 辅助 存储 的 磁盘 和 光盘 

程序 和 程序 操作 的 数据 保存 在 计算 机 的 存储 器 中 ， 在 这 一 章 我 们 将 讨论 计算 机 的 这 个 重 
要 部 分 是 如 何 运作 的 。 到 目前 为 止 ， 读 者 已 经 了 解 到 程序 的 执行 速度 很 大 程度 上 依赖 于 指令 和 
数据 在 处 理 器 与 存储 器 之 间 传 输 的 速度 。 此 外 ， 足 够 的 存储 器 对 于 加 快 拥有 大 量 数据 的 大 型 程 
序 的 执行 速度 也 是 十 分 重要 的 。 

从 理想 的 角度 考虑 ， 存 储 器 应 该 是 高 速度 、 大 容量 、 而 且 很 廉价 的 ， 但 不 幸 的 是 不 可 能 
同时 满足 这 三 个 要 求 ， 在 增加 速度 和 容量 的 同时 会 导致 成 本 的 增加 。 人 们 做 了 很 多 工作 去 开发 
一 些 结构 ， 这 些 结构 能 在 合理 的 成 本 范围 内 ， 提 高 存储 器 的 有 效 速度 和 有 效 容量 。 

如 第 1 章 所 述 ， 计 算 机 的 存储 器 构成 了 一 个 层次 结构 ， 包 括 高 速 缓存 、 主 存储 器 和 辅助 
存储 器 。 在 本 章 中 ， 我 们 将 描述 用 于 实现 这 些 部 件 的 最 常用 的 组 件 和 组 织 结构 。 引 入 直接 存储 
器 访问 作为 在 IO 设备 ( 如 磁盘 ) 和 主 存储 器 之 间 传 输 数据 的 机 制 ， 而 处 理 器 只 需 最 低 限 度 地 
参与 传输 过 程 。 我 们 将 分 析 存储 器 的 速度 ， 并 讨论 如 何 通过 使 用 高 速 缓存 的 方法 来 减少 存储 器 
数据 的 存 取 时 间 。 接 着 我 们 将 介绍 利用 辅助 存储 设备 的 大 存储 容量 来 增加 存储 器 有 效 容量 的 虚 
拟 存储 器 概念 。 我 们 首先 介绍 一 些 基 本 概念 ， 以 扩充 第 1 章 和 第 2 章 中 所 讨论 的 内 容 。 


8.1 基本 概念 


任何 一 台 计 算 机 中 能 使 用 的 存储 器 最 大 容量 取决 于 寻 址 方式 。 例 如 产生 16 位 地 址 的 计算 
机 能 寻 址 2“ = 64K ( kilo ) 个 存储 单元 。 能 产生 32 位 地 址 的 机 器 能 使 用 包含 22 = 4G ( giga) 
个 单元 的 存储 器 ， 而 64 位 地 址 的 机 器 能 访问 2% = 16E (exa ) = 16 x 108& 个 单元 。 单 元 的 数目 
表示 计算 机 地 址 空间 的 大 小 。 

存储 器 通常 被 设计 成 按 字 存储 和 检索 数据 。 例 如 ， 考 虑 一 台 能 产生 32 位 地 址 的 按 字 节 编 
址 的 计算 机 ， 当 处 理 器 给 存储 器 发 送 一 个 32 位 地 址 时 ， 其 中 高 30 位 的 地 址 决定 哪 一 个 字 被 访 
问 。 如 果 只 是 访问 一 个 字 节 ， 那 么 最 低 的 两 位 地 址 指定 哪 一 个 字 节 被 访问 。 

处 理 器 和 存储 器 之 间 的 连接 由 地 址 线 、 数 据 线 和 控制 线 组 成 ， 如 图 8-1 所 示 。 处 理 器 使 用 
地 址 线 指明 数据 传输 操作 中 的 存储 单元 ， 使 用 数据 线 传输 数据 。 同 时 ， 控 制 线 包含 指示 读 或 
写 操作 以 及 传输 一 个 字 节 还 是 一 个 字 的 命令 。 控 制 线 还 提供 必要 的 时 序 信息 ， 也 可 以 被 存储 器 
用 来 指明 它 何 时 完成 所 请 求 的 操作 。 当 处 理 器 一 存储 器 接口 接收 到 存储 器 的 响应 ， 它 发 出 如 
图 5-19 所 示 的 MFC 信号 。 这 是 处 理 器 的 内 部 控制 信号 ， 用 来 指示 所 请 求 的 存储 器 操作 已 经 完 
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成 。 当 发 出 该 信号 后 ， 处 理 器 继续 进行 执行 序列 中 的 下 一 步 。 
处 理 器 一 存储 器 接口 


最 多 2 个 可 编 址 单元 


字 长 =n 位 





图 8-1 存储 器 到 处 理 器 的 连接 


对 存储 器 速度 的 一 个 有 用 衡量 标准 是 从 开始 传输 一 个 数据 字 的 操作 到 结束 传输 所 用 的 时 
间 ， 这 被 称 为 存储 器 访问 时 间 (memory access time )。 另 一 个 重要 的 衡量 标准 是 存储 器 周期 时 
间 ( memory cycle time )， 它 是 指 两 个 连续 的 存储 器 操作 开始 时 刻 之 间 的 最 小 时 间 延 迟 ， 例 如 
两 个 连续 的 读 操作 之 间 的 时 间 。 一 般 来 说 ， 周 期 时 间 比 存 取 时 间 稍 长 ， 这 与 存储 器 的 实现 细节 
有 关 。 

如 果 任 何 一 个 存储 单元 的 访问 时 间 都 相同 ， 而 且 与 存储 单元 的 地 址 无 关 ， 那 么 这 个 存储 
句 就 称 为 随机 访问 存储 器 (random-access memory，RAM )。 这 个 定义 把 随机 访问 存储 器 与 连 
续 访 问 的 存储 设备 或 部 分 连续 访问 的 存储 设备 ， 例 如 磁盘 和 光盘 区 分 开 来 ， 后 者 的 访问 时 间 依 
赖 于 数据 的 地 址 或 位 置 。 

实现 计算 机 存储 器 的 技术 是 使 用 半导体 集成 电路 ， 后面 的 章节 将 介绍 一 些 关 于 随机 存储 
器 的 内 部 结构 和 操作 的 基本 情况 ， 然 后 我 们 再 讨论 增加 存储 器 有 效 速度 和 容量 的 技术 。 

1， 高 速 缓 存 和 虚拟 存储 器 

计算 机 处 理 器 处 理 指 令 和 数据 的 速度 通常 比 从 主 存储 器 中 获取 指令 和 数据 的 速度 快 ， 因 
此 ， 存 储 器 访问 时 间 是 整个 系统 的 瓶颈 。 减 少 存储 器 访问 时 间 的 一 个 办 法 是 使 用 高 速 缓存 
( cache memory )。 高 速 缓存 是 一 个 容量 小 、 速 度 快 的 存储 器 ， 它 在 容量 大 、 速 度 慢 的 主 存 与 处 
理 器 之 间 ， 保 存 当前 活动 的 程序 部 分 和 数据 。 

虚拟 存储 器 (virtual memory ) 是 关于 存储 器 结构 的 另 一 个 重要 概念 。 使 用 这 种 技术 ， 只 
需 将 程序 的 活动 部 分 存放 在 主 存储 器 中 ， 剩 余部 分 存放 在 较 大 容量 的 辅助 存储 设备 中 - 程序 段 
在 主 存储 器 和 辅助 存储 设备 之 间 来 回 地 传输 ， 这 对 应 用 程序 来 说 是 透明 的 。 因此， 应 用 程序 所 
看 到 的 存储 器 比 计算 机 中 的 物理 主 存储 器 大 得 多 。 

2. 块 传输 

上 面 的 讨论 表明 数据 经 常 在 主 存 和 高 速 缓存 之 间 、 主 存 和 磁盘 之 间 移 动 。 这 些 传输 不 是 
以 每 次 一 个 字 的 方式 发 生 的 ， 数 据 通 常 是 以 包含 几 十 、 几 百 甚至 几 千 个 字 的 邻近 块 的 方式 进行 
传输 的 。 主 存 和 图 形 显示 器 或 以 太 网 接口 这 样 的 高 速 设备 之 间 的 数据 传输 也 包含 大 块 的 数据 。 
因此 ， 主 存 性 能 的 一 个 关键 参数 是 其 高 速 读 写 数据 块 的 能 力 。 这 是 我 们 在 讨论 存储 器 技术 和 存 
储 器 系统 的 结构 时 会 反复 遇 到 的 一 个 重要 考虑 因素 。 


8.2 ”半导体 随机 存储 器 
半导体 随机 存储 器 (RAM ) 可 以 在 很 广泛 的 速度 范围 内 使 用 ， 它 们 的 周期 时 间 可 以 从 
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100ns 到 小 于 10ns。 在 这 一 节 中 ， 我 们 将 讨论 这 类 存储 器 的 主要 特性 。 首 先 介 绍 存储 器 单元 在 
芯片 内 的 组 织 方法 。 


8.2.1 存储 器 芯片 的 内 部 组 织 结构 

存储 器 单元 通常 按 阵列 的 形式 构成 ， 其 中 每 个 单元 存储 一 位 (bit ) 信息 。 图 8-2 描述 了 一 
种 可 能 的 组 织 方式 。 每 一 个 单元 行 组 成 存储 器 中 的 一 个 字 ， 一行 中 的 所 有 单元 通过 一 根 公 共 的 
线 连接 到 一 起 ， 这 根 线 称 为 字 线 ( word line )， 它 是 由 芯片 的 地 址 译 码 器 驱动 的 。 每 列 的 单元 
通过 两 条 位 线 (bit line ) 连接 到 一 个 读 出 / 写 (Sense/Write ) 电路 上 ， 读 出 / 写 电 路 连接 到 世 
片 的 数据 输入 /输出 线 上 。 在 读 操作 期 间 ， 这 些 电路 读 出 通过 字 线 选择 的 单元 所 存储 的 信息 ， 
并 把 这 些 信 息 放 到 输出 数据 线 上 。 在 写 操作 期 间 ， 读 出 / 写 电 路 接收 输入 数据 ， 并 把 它们 存储 
到 选 定 的 字 对 应 的 单元 中 。 

图 8-2 是 一 个 非常 小 的 存储 器 电路 的 例子 ， 它 包含 16 个 字 ， 每 个 字 包 括 8 位 ， 这 被 称 为 
16 x 8 结构 。 每 一 个 读 出 / 写 电 路 的 数据 输入 和 数据 输出 连接 到 一 条 双向 数据 线 上 ， 该 双向 数 
据 线 可 以 连接 到 计算 机 的 数据 线 上 。 还 有 两 条 控制 线 RMW 和 CS。R/W (Read/Write ) 输入 指 
定 请 求 的 操作 ， 而 CS ( 芯片 选择 ) 输入 可 在 多 芯片 存储 器 系统 中 选择 一 个 给 定 的 芯片 。 


bo 






数据 输入 /输出 线 ， 4b; 
图 8-2 存储 器 芯片 内 部 位 单元 的 组 织 结构 


图 8-2 中 的 存储 器 电路 存储 了 128 位 数据 ， 需 要 为 地 址 、 数 据 和 控制 提供 14 条 外 部 连接 
线 。 它 还 需要 两 条 线 用 于 电源 支持 和 接地 。 现 在 来 考虑 一 个 稍微 大 一 些 的 存储 器 电路 ， 它 包含 
1K( 1024 ) 个 存储 器 单元 。 这 个 电路 可 以 被 组 织 成 128 x 8 的 存储 器 ， 总 共 需 要 19 根 外 部 连 
接线 。 换 一 种 方式 ， 我 们 还 可 以 把 这 个 电路 组 织 成 1K x 1 的 形式 。 在 这 种 情况 下 ， 需 要 10 位 
地 址 ， 但 只 需要 一 根 数据 线 ， 因 此 共 需 要 15 根 外 部 连接 线 。 图 8-3 显示 了 这 种 组 织 结构 。 需 
要 的 10 位 地 址 被 分 成 两 组 ， 每 组 5 位 ， 分 别 构成 单元 阵列 的 行 地 址 和 列 地址 。 行 地 址 选择 一 
个 行 ， 包 含 32 个 存储 器 单元 ， 它 们 被 并 行 访问 。 但 是 ， 根 据 列 地 址 ， 这 些 单元 中 只 有 一 个 连 
接 到 外 部 数据 线 上 。 
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商业 上 可 用 的 存储 器 芯片 所 包含 的 存储 器 单元 数 比 图 8-2 和 图 8-3 显示 的 例子 要 多 得 多 ， 
我 们 使 用 小 的 例子 可 以 使 得 图 更 容易 理解 。 大 规模 芯片 的 组 织 结构 从 本 质 上 来 说 与 图 8-3 所 示 
的 一 样 ， 只 不 过 使 用 更 大 的 存储 器 单元 阵列 ， 并 且 有 更 多 的 外 部 连接 线 。 例 如 ， 一 个 1G 世 
的 组 织 结构 可 能 是 256M x 4， 这 时 需要 28 位 地 址 ， 可 向 或 从 芯片 传输 4 位 数据 。 


5 位 


32x32 
存储 器 
单元 阵列 


32-to-1 输出 多 
路 复 用 器 和 输入 





数据 输入 / 输出 
图 8-3 ”1K x 1 的 存储 器 芯片 组 织 结构 


8.2.2 ”静态 存储 器 

有 的 电路 只 要 不 停止 供电 ， 就 能 一 
直 保 持 它 的 状态 ， 由 这 样 的 电路 组 成 的 
存储 器 称 为 静态 存储 器 ( static memory )。 
图 8-4 描述 了 如 何 实 现 静 态 随机 存储 器 
(SRAM ) 单元 。 两 个 反 相 器 交叉 耦合 形 
成 一 个 锁 存 器 ， 锁 存 器 通过 晶体 管 六 和 
7 连接 到 两 根 位 线 上 ， 这 些 晶体 管 起 到 开 
关 的 作用 ， 可 以 在 字 线 的 控制 下 打开 或 关 
闭 。 当 字 线 在 低 电 平 时 ， 唱 体 管 断 开 ， 锁 
存 器 保持 它 的 状态 。 例 如 ， 如 果 和 点 的 逻 
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辑 值 为 1 且 Y 点 的 逻辑 值 为 0， 只 要 字 线 图 8-4 静态 随机 存储 器 单元 
的 信号 处 于 低 电 平 ， 这 个 状态 将 一 直 保持 下 去 。 假 设 这 个 状态 代表 值 1。 
1， 读 操作 


为 了 读 取 SRAM 单元 的 状态 ， 字 线 被 激活 以 闭合 开关 mh 和 TT。 如 果 单 元 处 于 状态 1， 那 
么 位 线 bp 上 的 信号 是 高 电 平 ， 而 位 线 bp' 上 的 信号 是 低 电 平 。 如 果 单 元 的 状态 为 0， 则 正好 相 
反 。 因 此 , b 和 b' 总 是 互补 的 。 位 于 这 两 根 位 线 末 端的 读 出 / 写 电路 监测 它们 的 状态 ， 并 相应 
地 设置 对 应 的 输出 。 

2.， 写 操作 

在 写 操作 期 间 ， 读 出 / 写 电路 驱动 位 线 bp 和 4b'， 而 不 是 读 出 它们 的 状态 。 它 把 适当 的 值 放 
到 位 线 bp 上， 并 把 它 的 补 值 放 到 b' 上 ， 激 活字 线 ， 这 样 就 迫使 单元 进入 相应 的 状态 ， 当 字 线 
失效 时 ， 单 元 就 一 直 保 持 这 个 状态 。 
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3. CMOS 单元 

实现 图 8-4 中 存储 器 单元 的 CMOS 单 
元 在 图 8-5 中 给 出 。 品 体 管 对 (7, Ts) 和 (Ti, 
7s) 形成 锁 存 器 中 的 反 相 器 ( 见 附录 A )。 
单元 的 状态 就 像 刚 才 解 释 的 那样 被 读 写 。 
例如 ， 位 于 状态 1 时 , 半点 保持 在 高 电 平 ， 
此 时 晶体 管 7 和 7 是 打开 的 , 而 Th 和 Ts 
是 关闭 的 。 如 果 工 和 元 打 开 , 位 线 b 和 b' 
将 分 别 具 有 高 电 平和 低 电 平 信号 。 

存储 器 单元 需要 持续 的 电压 供应 来 维 
持 它 的 状态 ， 如 果 电 源 中 断 了 ， 单 元 中 的 
内 容 就 会 丢失 。 当 电源 恢复 时 ， 单 元 中 的 
锁 存 器 进入 一 个 稳定 状态 ， 但 这 个 状态 不 
一 定 与 电源 中 断 前 单元 的 状态 相同 。 因 为 
存储 的 内 容 在 电源 中 断后 会 丢失 ， 所 以 SRAM 被 称 为 易 失 性 (volatile ) 存储 器 。 

CMOS 静态 随机 存储 器 的 一 个 主要 优点 是 它们 的 功 耗 非常 低 ， 因 为 只 有 被 访问 时 电流 才 
流入 存储 器 单元 。 此 外 ， 九 ,到 和 每 个 反 相 器 中 的 一 个 晶体 管 都 是 关闭 的 ， 这 样 保证 在 Vwpo 
和 地 之 间 没 有 持续 的 电气 通路 。 

静态 随机 存储 器 的 访问 速度 非常 快 ， 商 用 的 芯片 中 已 经 有 访问 时 间 大 约 为 几 纳 秒 的 芯片 。 
SRAM 通常 用 于 速度 至 关 重 要 的 应 用 场合 中 。 


8.2.3 动态 随机 存储 器 


静态 随机 存储 器 速度 很 快 ， 但 是 它们 的 存储 器 单元 需要 多 个 晶体 管 。 使 用 更 简单 的 存储 
器 单元 可 以 实现 更 廉价 的 、 更 高 密度 的 随机 存储 器 。 但 是 ， 这 些 更 简单 的 单元 不 能 长 期 地 保持 
它们 的 状态 ， 除 非 它们 被 经 常 访问 来 进行 读 或 写 操作 ， 使 用 这 种 单元 的 存储 器 被 称 为 动态 随机 
存储 器 (DRAM )。 

信息 以 电容 中 电荷 的 形式 保存 在 动态 存储 器 单元 中 ,但 这 些 电 荷 只 能 保持 几 十 毫秒 。 因 
为 我 们 需要 存储 器 单元 在 更 长 的 时 间 内 保存 信息 ， 因 此 必须 通过 把 电容 中 的 电荷 恢复 成 满 值 来 
定期 刷新 (refresh ) 存储 器 单元 中 的 内 容 。 当 存储 器 单元 中 的 内 容 被 读 出 或 者 当 新 的 信息 写 人 
存储 器 单元 的 时 候 会 对 存储 器 单元 进行 刷新 - 位 线 

图 8-6 显示 了 一 个 由 电容 C 和 晶体 管 了 组 成 的 动态 存储 
器 单元 的 例子 。 为 了 在 单元 中 存储 信息 ， 唱 体 管 了 打开 ， 并 
将 一 个 适当 的 电压 加 到 位 线 上 ， 这 使 得 一 定数 量 的 电荷 被 存 
储 到 电容 中 。 

晶体 管 关闭 后 ， 电 荷 仍然 存储 在 电容 中 ， 但 是 保存 时 间 
不 长 ， 电 容 就 开始 放电 ， 这 是 由 于 晶体 管 关闭 后 ， 仍 会 有 微 
弱 的 电流 通过 ， 这 个 电流 只 有 几 皮 安 。 因 此 只 有 在 电容 中 的 
电荷 降 到 低 于 某 个 国 值 之 前 ， 才 能 正确 读 出 存储 器 单元 中 存储 的 信息 。 在 读 操作 期 间 ， 选 中 单 
元 的 晶体 管 会 打开 ， 连 接 到 位 线 上 的 一 个 传 感 放 大 器 检测 电容 中 所 存储 的 电荷 是 否 高 于 或 低 于 
某 个 阔 值 。 如 果 电 和 荷 高 于 阔 值 ， 那 么 传 感 放大 器 把 位 线 上 的 电压 提高 成 满 电压 以 表示 逻辑 值 
1。 结果 ,电容 被 重新 充满 电荷 ， 使 它 对 应 逻辑 值 1。 如 果 传 感 放 大 器 检测 到 电容 中 的 电荷 低 











位 线 





图 8-5 ”CMOS 存储 器 单元 的 例子 





图 8-6 单 晶体 管 动 态 存储 器 单元 
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于 阔 值 ， 它 就 把 位 线 拉 成 低 电 平 ， 使 电容 完全 放电 。 因 而 ， 读 取 存 储 器 单元 内 容 的 时 候 会 自动 
刷新 它 的 内 容 。 因 为 字 线 对 于 一 行 中 的 所 有 单元 来 说 是 共用 的 ， 所 以 选 定 行 中 所 有 的 单元 被 同 
时 读 取 和 刷新 。 

图 8-7 显示 了 一 个 256M 位 的 DRAM 芯片 ， 被 配置 成 32M x 8 的 形式 。 存 储 器 单元 被 组 
织 成 16K x 16K 的 阵列 。 每 行 的 16384 个 单元 被 分 成 2048 组 ， 每 组 8 个 单元 ， 从 而 形成 2048 
字 节 的 数据 。 选 择 一 行 需要 14 位 地 址 ， 在 一 个 选 定 的 行 中 指定 一 个 8 位 的 组 还 需要 11 位 地 
址 。 因 此 ， 在 这 个 存储 器 中 访问 一 个 字 节 总 共 需 要 25 位 地 址 ， 高 14 位 和 低 11 位 分 别 构成 一 
个 字 节 的 行 地 址 和 列 地 址 。 为 了 减少 外 部 连接 的 引 脚 数 ， 行 地 址 和 列 地 址 多 路 复 用 14 根 引 脚 。 
在 读 或 写 操作 期 间 ， 行 地 址 首先 被 加 载 。 芯 片 响应 被 称 为 行 地 址 选 通 (RAS ) 的 输入 控制 线 上 
的 脉冲 信号 ， 把 行 地 址 装 和 信行 地 址 锁 存 器 中 。 这 将 导致 一 个 读 操作 开始 ， 选 定 行 中 的 所 有 单元 
被 读 取 和 刷新 。 
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图 8-7 32M x 8 的 动态 存储 器 芯片 的 内 部 组 织 结构 


行 地 址 被 装载 后 ， 列 地 址 立刻 被 加 载 到 地 址 引 脚 上 ， 然 后 在 第 二 根 被 称 为 列 地 址 选 通 
( CAS ) 的 控制 线 的 控制 下 ， 列 地 址 被 装 入 列 地 址 锁 存 器 中 。 列 地 址 锁 存 器 中 的 信息 被 译 码 ， 
该 列 地 址 对 应 的 一 个 8 位 组 的 读 出 / 写 电路 被 选中 。 如 果 R/W 控制 信号 指示 这 是 一 个 读 操作 ， 
那么 选 定 电路 的 输出 值 被 传输 到 数据 线 D1-。 上 。 如 果 是 一 个 写 操作 ，D;.。 线 上 的 信息 被 传输 
给 选 定 的 电路 ， 然 后 用 这 些 信息 覆盖 选 定 的 8 列 存储 器 单元 的 内 容 。 我 们 应 该 注意 ， 在 商业 
DRAM 芯片 中 , RAS 和 CAS 控制 信号 是 低 电 平 有 效 ， 因 此 当 这 些 信 号 从 高 电 平 变 成 低 电 平时 ， 
地 址 被 锁 存 。 为 了 表示 这 种 情况 ， 在 图 中 这 些 信 号 被 表示 成 RAS 和 CAS。 

上 面 描述 的 DRAM 操作 的 时 序 是 由 RAS 和 CAS 信和 号 控制 的 。 当 处 理 器 发 出 一 个 读 或 
写 命令 时 ， 这 些 信 号 由 芯片 外 部 的 一 个 存储 控制 器 电路 产生 。 在 读 操作 期 间 ， 在 一 个 相当 于 
存储 器 访问 时 间 的 延迟 后 ， 输 出 数据 被 传输 到 处 理 器 。 这 种 存储 器 称 为 异步 动态 随机 存储 器 
(asynchronous DRAM )。 存 储 控制 器 还 负责 对 存储 在 存储 器 芯片 中 的 数据 进行 刷新 ， 我 们 稍 后 
将 描述 。 

快速 页 模式 

当 图 8-7 所 示 的 DRAM 被 访问 时 ， 选 中 行 的 16384 个 单元 的 内 容 都 被 读 取 ， 但 是 只 有 8 
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位 信息 被 放 在 数据 线 Di。 上 ， 这 个 字 节 通过 列 地 址 位 A1o-o 来 选择 。 可 以 对 电路 做 一 个 简单 的 
修改 ， 使 得 在 访问 同一 行 中 其 他 字 节 的 时 候 不 需要 重新 进行 行 选择 。 每 个 传 感 放大 器 也 可 用 作 
一 个 锁 存 器 ， 当 加 载 行 地 址 的 时 候 ， 选 定 行 中 所 有 单元 的 内 容 都 被 装 和 人 相应 的 锁 存 器 中 。 于 
是 ， 只 要 加 载 不 同 的 列 地 址 就 能 把 该 行 的 其 他 字 节 放 到 数据 线 上 。 

这 种 方式 将 会 导致 一 个 非常 有 用 的 功能 ， 即 ， 在 连续 的 CAS 信号 控制 下 通过 加 载 连续 的 
列 地 址 序列 就 可 以 按 顺序 传输 选 定 行 中 的 所 有 字 节 。 因 此 ， 一 块 数 据 的 传输 要 比 使 用 随机 地 址 
传送 的 速率 快 得 多 。 这 种 块 传输 能 力 被 称 为 快速 页 模式 ( fast page mode )。( 一 大 块 数据 通常 被 
称 为 一 页 。) 

以 前 我 们 就 指出 过 ， 绝 大 多 数 的 主 存储 器 事务 都 涉及 块 传输 。 使 用 快速 页 模式 获得 的 高 
速率 特性 使 得 动态 随机 存储 器 特别 适合 这 种 环境 。 


8.2.4 同步 动态 随机 存储 器 

20 世纪 90 年 代 初 ， 随 着 存储 器 技术 的 发 展 ， 出 现 了 操作 与 时 钟 信号 同步 的 动态 随机 存储 
器 ， 这 种 存储 器 被 称 为 同步 动态 随机 存储 器 ( synchronous DRAM，SDRAM )， 其 结构 如 图 8-8 
所 示 。 它 的 单元 阵列 与 异步 动态 随机 存储 器 一 样 。SDRAM 的 显著 特点 是 使 用 时 钟 信 号 ， 这 使 
得 它 可 以 在 芯片 上 包含 控制 电路 ， 提 供 许 多 有 用 的 功能 。 例 如 ，SDRAM 有 内 置 的 刷新 电路 ， 
用 一 个 刷新 计数 器 来 提供 要 刷新 的 行 地 址 。 因 此 ， 这 些 存 储 器 芯片 的 动态 特性 对 用 户 来 说 几乎 
是 不 可 见 的 。 

SDRAM 的 地 址 和 数据 连接 可 以 如 图 8-8 中 所 示 的 那样 通过 寄存 器 进行 缓冲 。 同 异步 
DRAM 一 样 ， 读 出 / 写 放大 器 用 作 锁 存 器 。 读 操作 使 得 选中 行 中 所 有 单元 的 内 容 被 装 人 锁 存 
器 。 锁 存 器 中 选中 列 的 数据 被 传输 到 数据 寄存 器 中 ， 然 后 就 可 以 在 数据 输出 引 脚 上 获得 这 些 数 
据 。 当 以 很 快 的 速度 传输 大 块 数据 时 ， 缓 冲 寄存 器 是 非常 有 用 的 。 通 过 将 外 部 连接 与 芯片 的 内 
部 电路 分 离开 来 ， 在 向 或 从 寄存 器 传输 数据 时 ， 就 有 可 能 开始 一 个 新 的 数据 访问 操作 。 


行 / 列 
地 址 





图 8-8 同步 动态 随机 存储 器 


第 8 章 ”存储 器 系统 : 181 


SDRAM 有 几 种 不 同 的 操作 模式 ， 可 以 通过 向 模式 (mode ) 寄存 器 中 写 人 控制 信息 来 选 
择 这 些 模式 ， 例 如 可 以 指定 不 同 长 度 的 块 操作 。 选 择 连续 的 列 不 需要 在 CAS 线 上 提供 外 部 产 
生 的 脉冲 ， 芯 片 内 部 使 用 列 计数 器 和 时 钟 信号 就 能 产生 所 需要 的 控制 信号 。 新 数据 在 每 个 时 钟 
脉冲 的 上 升 沿 被 放 到 数据 线 上 。 

图 8-9 是 一 个 典型 的 长 度 为 4 的 读 脉冲 串 时 序 图 。 首 先 ， 行 地 址 在 RAS 信号 的 控制 下 被 
锁 存 。 存 储 器 通常 使 用 5 个 或 6 个 时 钟 周期 ( 为 简单 起 见 ， 在 图 中 我 们 使 用 2 个 ) 激活 选中 的 
行 。 然 后 ， 列 地 址 在 CAS 信和 号 的 控制 下 被 锁 存 。 一 个 时 钟 周期 的 延迟 后 ， 第 一 组 数据 被 放 到 
数据 线 上 。 然 后 SDRAM 自动 增加 列 地 址 去 访问 选 定 行 中 后 面 的 三 组 数据 ， 在 随后 的 3 个 时 钟 
周期 中 把 这 三 组 数据 放 到 数据 线 上 。 


数据 
图 8-9 在 SDRAM 中 长 度 为 4 的 读 脉冲 串 


同步 SDRAM 可 以 以 非常 快 的 速度 传递 数据 ， 因 为 所 需要 的 所 有 控制 信号 都 是 在 芯片 内 
部 产生 的 。20 世纪 90 年 代 设 计 出 了 最 初 的 商业 SDRAM， 其 时 钟 频 率 高 达 133MHz。 随 着 技 
术 的 发 展 ， 开 发 出 了 更 快速 的 SDRAM 芯片 。 现 在 的 SDRAM 可 以 在 超过 1GHz 的 时 钟 速度 下 
王 作 。 

1， 延迟 与 带宽 

向 或 从 主 存储 器 传输 的 数据 通常 包括 数据 块 。 这 些 传输 的 速度 对 计算 机 系统 的 性 能 影响 
很 大 。 在 传输 数据 块 时 ， 前 面 定义 的 存储 器 访问 时 间 就 不 足以 描述 存储 器 的 性 能 了 。 在 块 传 
输 期 间 ， 存 储 器 延迟 (memory latency ) 是 传输 块 的 第 一 个 字 所 花费 的 时 间 。 传 输 一 个 完整 
的 块 所 需要 的 时 间 还 依赖 于 后 继 字 的 传输 速度 以 及 块 的 大 小 。 传 输 块 中 后 继 字 的 时 间 比 传输 
第 一 个 字 所 需要 的 时 间 要 短 得 多 。 例 如 ， 在 图 8-9 所 示 的 时 序 图 中 ， 当 RAS 信号 出 现时 , 访 
问 周 期 开始 ， 第 一 个 字 在 五 个 时 钟 周期 后 传输 ， 因 此 延迟 是 五 个 时 钟 周 期 。 如 果 时 钟 频率 是 
500MHz， 那 么 延迟 是 10ns。 剩 下 的 三 个 字 在 后 续 的 时 钟 周 期 中 传输 ， 每 2ns 传输 一 个 字 。 

上 面 的 例子 表明 ， 在 块 传输 期 间 ， 我 们 需要 除了 存储 器 延迟 之 外 的 另 一 个 参数 来 描述 存 
储 器 的 性 能 。 一 个 有 用 的 性 能 衡量 标准 是 一 秒 钟 之 内 能 传输 的 位 或 字 节 的 数量 ， 这 个 衡量 标准 
通常 被 称 为 存储 器 带宽 (bandwidth )。 它 依赖 于 访问 存储 数据 的 速度 和 能 并 行 访问 的 位 数 。 向 
或 从 存储 器 传输 数据 的 速率 依赖 于 系统 互 连 的 带宽 。 为 此 ， 所 使 用 的 互 连 需要 始终 确保 处 理 器 
和 存储 器 之 间 的 数据 传输 的 可 用 带宽 是 非常 高 的 。 
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2， 双 倍数 据 速率 SDRAM 

通过 对 提高 性 能 的 不 断 探索 , SDRAM 的 更 快 版 本 已 被 开发 出 来 。 除 了 采用 更 快 的 电路 外 ， 
新 的 组 织 和 操作 特点 使 它 有 可 能 在 块 传输 期 间 获 得 高 速 的 数据 传输 率 。 其 核心 思想 是 利用 存储 
器 在 加 载 一 个 行 地 址 时 ， 会 同时 访问 芯片 内 大 量 的 位 这 个 特点 。 可 使 用 各 种 技术 将 这 些 位 快速 
传输 到 芯片 的 引 脚 上 。 为 了 充分 利用 可 用 的 时 钟 速度 ， 在 时 钟 的 上 升 沿 和 下 降 沿 都 传输 数据 。 
因此 ， 使 用 这 种 技术 的 存储 器 称 为 双 倍 数据 数 率 SDRAM ( double-data-rate SDRAM，DDR 
SDRAM )。 

已 经 开发 出 了 多 个 版 本 的 DDR 芯片 。 最 早 的 版 本 被 称 为 DDR。 后 来 的 版 本 DDR2， 
DDR3 和 DDR4 具有 增强 的 功能 。 它 们 提供 了 更 大 的 存储 容量 、 更 低 的 功率 以 及 更 快 的 时 钟 速 
度 。 例 如，DDR2 和 DDR3 可 分 别 在 400MHz 和 800MHz 的 时 钟 频率 下 工作 。 因 此 ， 它 们 分 别 
使 用 800MHz 和 1600MHz 的 有 效 时 钟 速度 传输 数据 。 

3，Rambus 存储 器 

在 存储 器 和 处 理 之 间 传 输 数据 的 速率 是 存储 器 的 带宽 和 存储 器 到 处 理 器 的 连接 的 带宽 的 
函数 。Rambus 是 一 种 可 以 获得 高 速 的 数据 传输 率 的 存储 器 技术 ， 它 通过 在 存储 器 和 处 理 器 之 
间 提 供 一 个 高 速 的 接口 来 实现 。 增 加 这 个 连接 带宽 的 一 种 方法 是 使 用 更 宽 的 数据 通路 。 然 而 ， 
这 需要 更 大 的 空间 和 更 多 的 引 脚 ， 从 而 增加 了 系统 的 成 本 。 另 一 种 方法 是 使 用 较 少 的 线路 但 具 
有 更 高 的 时 钟 速度 。 这 是 Rambus 公司 采用 的 方法 。 

Rambus 技术 的 关键 特性 是 在 向 或 从 存储 器 芯片 传输 数据 时 使 用 了 差分 信号 技术 。 差 分 信 
号 的 基本 思想 在 7.5.1 节 中 描述 。 在 Rambus 技术 中 ， 使 用 在 一 个 参考 值 上 下 0.1V 浮动 的 微小 
电压 来 传输 信和 号。 该 标准 已 经 开发 出 了 多 个 版 本 ， 时 钟 速度 高 达 800MHz， 数 据 传输 率 达 到 每 
秒 数 千 兆 字 节 。 

Rambus 技术 直接 与 DDR SDRAM 技术 竞争 ， 它 们 各 自 有 各 自 的 优点 和 缺陷 。 一 个 非 技术 
因素 是 ，DDR SDRAM 的 规范 是 一 个 开放 的 标准 ， 可 以 免费 使 用 。 而 另 一 方面 ，Rambus 是 一 
个 私有 的 方案 ， 必 须 由 芯片 生产 商 授权 才能 使 用 。 


8.2.5 大 容量 存储 器 的 结构 

我 们 已 经 讨论 了 存储 器 电路 的 基本 组 织 结构 ， 它 们 可 以 在 一 个 单独 的 芯片 上 实现 ， 下 面 
来 分 析 存 储 器 芯片 如 何 连接 到 一 起 形成 更 大 的 存储 器 。 

1， 静 态 存储 器 系统 

考虑 一 个 由 2M 个 32 位 的 字 组 成 的 存储 器 ， 图 8-10 显示 了 如 何 使 用 512K x 8 的 静态 存储 
器 芯片 来 实现 这 个 存储 器 。 图 中 每 一 列 实现 了 一 个 字 中 一 个 字 节 的 位 置 ， 用 四 个 芯片 提供 2M 
个 字 节 。 四 列 合 起 来 实现 了 所 需要 的 2M x 32 的 存储 器 。 每 一 个 芯片 有 一 个 控制 输入 ， 被 称 为 
芯片 选择 (Chip Select )， 当 这 个 输入 被 置 成 1 时 ， 人 允许 芯片 从 数据 线 上 接收 数据 或 把 数据 放 到 
数据 线 上 。 每 个 芯片 的 数据 输出 都 是 7.2.3 节 中 所 描述 的 三 态 类 型 的 ， 只 有 选中 的 芯片 才能 把 
数据 放 到 数据 输出 线 上 ， 所 有 其 他 芯片 的 输出 都 与 数据 线 断 开 连 接 。 选 择 存储 器 中 一 个 32 位 
的 字 需 要 21 个 地 址 位 ， 地 址 的 高 2 位 被 译 码 ， 用 来 决定 选择 4 行 中 的 哪 一 行 ， 其 余 的 19 个 地 
址 位 用 来 在 选中 行 的 每 个 芯片 内 指定 访问 哪个 字 节 位 置 。 所 有 芯片 的 R/W 输入 连 到 一 起 提供 
一 个 共用 的 Read/Write 控制 线 ( 没有 在 图 中 显示 ). 

2. 动态 存储 器 系统 

现代 计算 机 使 用 非常 大 的 存储 器 ， 即 使 是 小 型 的 个 人 计算 机 也 可 能 至 少 有 1G 字 节 的 内 
存 ， 典 型 的 台式 计算 机 可 能 有 4G 字 节 或 更 大 的 内 存 。 大 容量 的 内 存 会 带 来 更 好 的 性 能 ， 因 为 
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更 多 当前 正 被 处 理 的 程序 和 数据 能 被 保存 在 内 存 中 ， 从 而 能 降低 访问 辅助 存储 设备 的 频率 。 
21 位 地 址 
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19 位 内 部 芯片 地 址 
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S512Kx8 
存储 器 芯片 D31.24 D23-16 D1s.8 D7.0 


512K x 8 存储 器 芯片 


19 位 8 位 数据 
地 址 输入 /输出 


芯片 选择 
图 8-10 使 用 512K x 8 静态 存储 器 芯片 的 2M x 32 存储 器 模块 的 组 织 结构 


因为 位 密度 高 ， 成 本 低 ， 动 态 随机 存储 器 ( 大 多 是 同步 类 型 的 ) 被 广泛 应 用 在 计算 机 的 
存储 器 中 。 它 们 比 静 态 随机 存储 器 慢 ， 但 它们 使 用 较 少 的 电量 ， 有 相当 低 的 位 价格 。 可 用 的 
芯片 有 高 达 2G 位 的 容量 ， 甚 至 更 大 容量 的 芯片 也 正在 开发 中 。 为 了 减少 给 定 计算 机 中 所 需要 
的 存储 器 芯片 的 数量 ， 存 储 器 芯片 可 被 组 织 成 能 并 行 读 或 写 很 多 位 的 形式 ， 如 图 8-7 所 示 的 情 
况 。 世 片 被 生产 成 不 同 的 组 织 结构 ， 这 样 在 设计 存储 器 系统 时 可 以 提供 足够 的 灵活 性 。 例 如 ， 
1G 位 的 芯片 可 以 被 组 织 成 256M x 4 或 者 128M x 8。 

封装 因素 导致 了 被 称 为 存储 器 模块 的 组 装 技 术 的 发 展 。 每 一 个 这 样 的 模块 将 许多 存储 器 
芯片 (通常 为 16 到 32 个 ) 放置 到 一 块 小 板 上 ， 然 后 再 把 小 板 插 入 到 计算 机 主板 的 一 个 槽 中 。 
根据 引 脚 的 配置 ， 存 储 器 模块 通常 被 称 为 SIMM ( Single In-line Memory Module， 单 列 直 插 存 
储 器 模块 ) 或 DIMM ( Dual In-line Memory Module， 双 列 直 插 存 储 器 模块 )。 不 同 容 量 的 模块 
被 设计 成 使 用 相同 的 槽 ， 例 如 ，128M x 64 位 、256M x 64 位 和 512M x 64 位 的 DIMM 都 使 用 
240 针 的 柳 。 这 样 ， 通 过 把 使 用 相同 横 的 小 模块 替换 成 大 模块 的 方式 ， 存 储 器 的 总 容量 很 容易 
进行 扩展 。 
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3.， 存储 控制 器 

正如 前 面 所 解释 的 那样 ， 加 载 到 动态 随机 存储 器 芯片 上 的 地 址 被 分 成 两 个 部 分 ， 高 地 址 
位 用 来 选择 存储 器 单元 阵列 的 行 ， 它 们 首先 被 提供 ， 并 在 RAS 信和 号 的 控制 下 锁 存 在 存储 器 世 
片 中 。 低 地 址 位 用 来 选择 列 ， 它 们 随后 通过 相同 的 地 址 引 脚 提供 ， 并 在 CAS 信号 的 控制 下 锁 
存 。 因 为 典型 的 处 理 器 同时 发 出 所 有 的 地 址 位 ， 所 以 需要 一 个 多 路 复 用 器 。 这 种 多 路 复 用 功能 
通常 由 存储 控制 器 (memory controller ) 电路 完成 。 控 制 器 在 请 求 ( request ) 信和 号 的 控制 下 从 
处 理 器 接收 一 个 完整 的 地 址 和 R/W 信号， 请 求 信 号 表示 需要 一 个 存储 器 访问 操作 。 控 制 器 把 
R/W 信和 号 和 行 地 址 、 列 地 址 传 给 存储 器 ， 并 产生 具有 正确 时 序 的 RAS 和 CAS 信号 。 当 存储 器 
包含 多 个 模块 时 ， 可 根据 地 址 的 高 位 部 分 选择 其 中 的 一 个 模块 。 存 储 控制 器 将 这 些 高 地 址 位 进 
行 译 码 ， 生 成 选择 适当 模块 的 芯片 选择 信和 号。 处理 器 和 存储 器 之 间 的 数据 线 是 直接 连接 的 。 

动态 随机 存储 器 必须 定期 刷新 。 发 起 刷新 周期 所 需 的 电路 是 同步 DRAM 内 部 控制 电路 的 
一 部 分 。 然 而 ， 异 步 DRAM 需要 芯片 外 部 的 控制 电路 来 发 起 周期 性 的 读 周期 以 刷新 其 存储 器 
单元 ， 存 储 控制 器 可 以 提供 这 种 功能 。 

4， 刷 新 开销 

当 内 部 刷新 操作 正在 进行 时 ， 动 态 随机 存储 器 不 能 响应 读 或 写 请 求 。 这 些 请 求 被 延 
迟 ， 直 到 刷新 周期 结束 。 但 是 ， 为 完成 刷新 操作 所 损失 的 时 间 是 非常 小 的 。 例 如 ， 考 虑 一 
个 SDRAM， 其 中 每 一 行 需要 每 阳 64ms 刷新 一 次 。 假 设 访问 两 行 之 间 的 最 短 时 间 为 50ns， 
刷新 操作 要 被 安排 成 可 使 得 芯片 的 所 有 行 在 8K (8192 ) 个 刷新 周期 中 被 刷新 。 因 此 ， 需 要 
8192 x 0.050=0.41ms 来 刷新 所 有 行 。 刷 新 开销 是 0.41 / 64 = 0.0064， 它 小 于 访问 存储 器 可 用 总 
时 间 的 1%。 

5. 技术 的 选择 

为 给 定 的 应 用 选择 随机 存储 器 芯片 要 考虑 多 个 因素 ， 其 中 最 重要 的 是 成 本 、 速 度 、 功 耗 
和 芯片 容量 。 

静态 随机 存储 器 的 特征 是 它们 的 高 速 操作 。 但 是 ， 它 们 的 成 本 和 位 密度 受 实 现 基本 单元 
所 需 电 路 的 复杂 程度 的 影响 。 静 态 随 机 存储 器 大 部 分 用 于 小 容量 的 但 速度 非常 快 的 存储 器 中 。 
而 另外 ， 动 态 随 机 存储 器 具有 较 高 的 位 密度 和 较 低 的 位 价格 。 同 步 动态 随机 存储 器 是 实现 主 存 
储 器 的 主要 选择 。 


8.3 ”只 读 存 储 器 


静态 随机 存储 器 和 动态 随机 存储 器 芯片 都 是 易 失 的 ， 这 意味 着 只 有 当 电源 打开 时 ， 它 们 
才能 保持 信息 。 有 很 多 应 用 要 求 存储 器 设备 在 电源 关闭 后 仍 能 保留 它 所 存储 的 信息 。 例 如 ， 第 
4 章 描述 了 需要 在 这 样 的 存储 器 中 存储 一 个 小 程序 ， 用 于 启动 引导 过 程 ， 来 将 操作 系统 从 硬盘 
装 入 主 存 中 。 第 10 章 和 第 11 章 描述 的 做 入 式 应 用 是 另 一 个 重要 的 例子 。 许 多 对 人 式 应 用 不 使 
用 硬盘 而 需要 使 用 非 易 失 性 的 存储 器 来 存储 它们 的 软件 。 

现在 已 经 开发 出 了 不 同类 型 的 非 易 失 性 存储 器 。 通 常 ， 可 以 采用 上 面 讨论 的 易 失 性 存储 
器 所 用 的 方法 来 读 取 非 易 失 性 存储 器 的 内 容 。 但 是 ， 把 信息 存 人 非 易 失 性 存储 器 需要 一 个 特殊 
的 写 过程 。 因 为 它们 一 般 的 操作 只 涉及 读 取 所 存储 的 数据 ， 因 此 这 种 类 型 的 存储 器 称 为 只 读 存 
储 器 (read-only memory，ROM )。 


8.3.1 ROM 
言 息 只 在 存储 器 生产 时 被 写 人 一 次 ， 这 样 的 存储 器 称 为 只 读 存 储 器 ， 或 者 ROM。 图 8-11 
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显示 了 一 种 可 能 的 ROM 单元 结构 ， 如 果品 体 管 在 P 点 接地 ， 那 么 单元 存储 的 敢 辑 值 为 0， 否 
则 为 1。 位 线 通过 一 个 电阻 连 到 电源 线 上 。 要 读 取 ”位 线 

单元 的 状态 ， 需 要 激活 字 线 以 闭合 晶体 管 开关 。 因 
此 ， 如 果 晶 体 管 接地 的 话 ， 位 线 上 的 电压 会 降 到 接 
近 0 电位; 如 果 没有 接地 的 话 ， 位 线 上 的 电压 仍然 
保持 高 电位 ， 表 示 逮 辑 值 1。 位 线 末 端的 传 感 电路 


字 线 






~ 连接 时 存储 “0” 


产生 正确 的 输出 值 。 每 个 单元 中 的 接地 状态 是 在 芯 不 连接 时 存储 “" 
片 制造 时 通过 使 用 一 个 拖 码 来 决定 的 ， 该 掩 码 表示 
轴 小 信息 的 寞 二 图 8-11 只 读 存储 器 单元 


8.3.2 PROM 

有 些 ROM 设计 成 由 用 户 装 入 数据 ， 即 可 编程 只 读 存 储 器 ( programmable ROM，PROM )。 
可 编程 能 力 是 通过 在 图 8-11 中 的 PP 点 插入 一 根 熔 丝 实现 的 。 在 编程 之 前 ， 存 储 器 包含 的 内 容 
全 是 0。 用 户 可 以 通过 使 用 高 电流 脉冲 把 所 需 位 置 的 熔 丝 烧 断 ， 使 那些 位 置 的 值 为 1。 当然， 
这 个 过 程 是 不 可 逆 的 。 

PROM 提供 了 ROM 不 具备 的 灵活 性 和 方便 性 。 为 准备 存储 特定 信息 需要 的 掩 码 所 付出 的 
成 本 使 得 ROM 仅 在 大 批量 生产 时 比较 划算 。 另 一 种 PROM 技术 提供 了 一 种 更 方便 并 且 非 常 
廉价 的 方法 ， 因 为 存储 器 芯片 可 以 直接 由 用 户 编程 。 


8.3.3 EPROM 


另 一 种 ROM 芯片 提供 了 更 高 层次 的 方便 性 ， 它 允许 擦 除 存储 的 数据 ， 并 写 和 新 的 数据 。 
这 种 可 擦 除 (erasable )、 可 再 编程 的 ROM 通常 被 称 为 可 擦 除 可 编程 只 读 存 储 器 ( EPROM )， 
它 在 数字 系统 的 开发 阶段 提供 了 相当 大 的 灵活 性 。 因 为 EPROM 能 在 很 长 的 时 间 内 保存 数据 ， 
所 以 当 软 件 正在 被 开发 的 时 候 ， 可 以 用 它们 来 蔡 换 ROM 或 PROM。 通过 这 种 方法 ， 可 以 很 容 
易 地 实现 存储 信息 的 改变 和 升级 。 

EPROM 单元 的 结构 与 图 8-11 中 的 ROM 单元 相似 。 但 是 , P 点 是 通过 一 个 特殊 的 晶体 管 
接地 的 ， 这 个 晶体 管 通常 是 关闭 的 ， 形 成 一 个 打开 的 开关 。 可 以 通过 向 晶体 管 注 和 人 电荷 来 打 
开 晶 体 管 ， 注 入 的 电荷 在 晶体 管内 部 被 捕获 。 这 样 ，EPROM 单元 可 以 用 前 面 讨论 的 ROM 单 
元 所 用 的 方法 来 构建 存储 器 。 擦 除 需要 驱散 组 成 存储 器 单元 的 晶体 管 所 捕获 的 电荷 ， 这 可 以 
通过 把 芯片 暴露 在 紫外 线 下 照射 来 完成 ， 紫 外 线 可 擦 除 芯片 上 所 有 的 内 容 。 为 了 做 到 这 一 点 ， 
EPROM 芯片 被 安装 在 有 透明 窗口 的 外 壳 中 。 


8.3.4 EEPROM 


EPROM 重新 编程 时 必须 从 电路 上 物理 地 移 除 。 并 且 ， 所 存储 的 信息 不 能 有 选择 地 擦 除 ， 
当世 片 暴露 在 紫外 线 下 照射 时 ， 它 所 有 的 内 容 都 会 被 擦 除 。 另 一 种 可 控 除 的 PROM 可 以 用 
电 来 编程 、 擦 除 和 青 编程 ， 这 样 的 芯片 叫做 电 可 擦 除 可 编程 只 读 存 储 器 (electrically erasable 
PROM，EEPROM )， 擦 除 时 不 需要 把 它 从 电路 上 移 除 ， 而 且 ， 还 可 以 有 选择 地 擦 除 存储 器 单 
元 中 的 内 容 。EEPROM 的 一 个 不 足 是 擦 除数 据 、 写 数据 和 读数 据 时 需要 用 不 同 的 电压 ， 这 增 
加 了 电路 的 复杂 性 。 然 而 ， 这 个 不 足 被 EEPROM 的 许多 优点 超过 ， 在 实践 中 它们 已 经 取代 了 
EPROM。 
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8.3.5 闪存 

一 种 与 EEPROM 技术 类 似 的 方法 出 现 了 ， 它 就 是 闪存 (flash memory ) 设备 。 闪 存单 元 
基于 一 个 由 捕获 电荷 控制 的 单独 晶体 管 ， 很 像 EEPROM 单元 。 在 闪存 中 可 以 读 取 单个 单元 的 
内 容 ， 这 跟 EEPROM 也 很 类 似 。 关 键 的 不 同 是 ， 在 闪存 中 只 能 写 入 整 块 单元 的 内 容 。 在 写 之 
前 ， 这 个 块 以 前 存储 的 内 容 被 擦 除 。 闪 存 有 更 高 的 密度 ， 这 可 以 带 来 更 高 的 容量 和 更 低 的 位 成 
本 。 它 们 只 需要 单一 的 电压 ， 而 且 在 操作 中 消耗 更 少 的 能 量 。 

低 功 耗 使 得 闪存 在 便携 式 、 电 池 供 电 的 设备 应 用 中 有 很 强 的 吸引 力 。 典 型 的 应 用 包括 手 
持 计算 机 、 蜂 窝 电话 、 数 码 相 机 和 MP3 音乐 播放 器 。 在 手持 计算 机 和 蜂窝 电话 中 ， 闪 存 保存 
操作 设备 所 需要 的 软件 ， 这 样 就 免除 了 对 磁盘 的 需求 。 在 数码 相机 中 ， 内 存 用 来 保存 图 片 数 
据 。 在 MP3 播放 器 中 ， 闪 存 存 储 表示 声音 的 数据 。 蜂 窝 电话 、 数 码 相 机 和 MP3 播放 器 是 很 好 
的 做 人 式 系统 的 例子 ， 这 些 将 在 第 10 章 和 第 11 章 讨 论 。 

单独 的 闪存 芯片 不 能 为 上 面 提 到 的 应 用 提供 足够 的 存储 容量 ， 可 以 使 用 由 多 个 芯片 组 成 
的 更 大 的 存储 器 模块 。 实 现 这 样 的 模块 时 有 两 种 常见 的 选择 : 闪存 卡 和 闪存 驱动 器 。 

1， 内 存 卡 

构建 更 大 模块 的 一 个 方法 是 把 闪存 芯片 安装 到 一 个 小 卡片 上 ， 这 样 的 闪存 卡 有 一 个 标准 
的 接口 ， 这 使 得 它们 可 以 用 在 不 同 的 产品 上 。 卡 片 只 需要 简单 地 插入 到 一 个 可 以 很 方便 接触 到 
的 槽 上 。 具 有 USB 接口 的 闪存 卡 被 广泛 地 使 用 ， 通 常 被 称 为 存储 键 。 它 们 有 不 同 的 容量 ， 较 
大 的 闪存 卡 可 以 存储 多 达 32G 字 节 的 数据 。 使 用 MP3 编码 格式 时 ， 一 分 钟 的 音乐 可 以 存储 在 
大 约 1M 字 节 的 存储 器 中 ， 因 此 ， 一 个 32G 字 节 的 闪存 卡 可 以 存储 大 约 500 小 时 的 音乐 。 

2 闪存 驱动 器 

更 大 容量 的 闪存 模块 已 经 被 开发 出 来 ， 可 以 替换 硬盘 驱动 器 ， 因 此 被 称 为 闪存 驱 动 器 。 
它们 完全 仿效 硬盘 设计 ， 可 以 装 入 标准 的 磁盘 驱动 器 架 中 。 但 是 闪存 驱动 器 的 存储 容量 太 低 
了 ， 目 前 闪存 驱动 器 的 容量 大 约 为 64G 到 128G 字 节 。 相 比 之 下 ， 硬 盘 的 容量 已 超过 1T 字 节 。 
另外 ， 磁 盘 驱 动 器 每 位 的 成 本 非常 低 。 

闪存 驱动 器 是 没有 可 移动 部 分 的 固态 电子 设备 ， 这 为 它们 提供 了 一 些 超过 磁盘 驱动 器 的 
重要 优点 。 它 们 有 更 短 的 访问 时 间 ， 从 而 有 更 短 的 响应 时 间 。 它 们 受 震 动 的 影响 很 小 ， 并 且 有 
更 低 的 功 耗 ， 这 使 得 它们 在 便携 式 的 、 电 池 驱 动 的 应 用 中 有 很 大 的 吸引 力 。 


8.4 直接 存储 器 访问 


主 存储 器 和 IO 设备 〈 比如 磁盘 ) 之 间 经 常 进行 数据 块 传输 。 这 一 节 将 讨论 一 种 控制 这 种 
传输 的 技术 ， 不 需要 处 理 器 频繁 地 进行 程序 控制 干预 。 

第 3 章 中 主要 讨论 的 是 处 理 器 和 IO 设备 之 间 的 单字 或 单字 节 数 据 传输 。 将 数据 从 IO 设 
备 传输 到 存储 器 ， 首 先 要 使 用 一 条 指令 如 : 

Load R2, DATAIN 

将 数据 从 IO 设备 读 出 来 装 入 处 理 器 的 寄存 器 中 ; 然后 ， 将 读 出 的 数据 存放 到 存储 单元 中 。 将 
数据 从 存储 器 传输 到 LO 设备 就 进行 一 个 相反 的 过 程 。 传 递 输入 或 输出 数据 的 指令 只 有 在 处 理 
器 确定 IO 设备 准备 就 绪 时 才能 执行 ， 处 理 器 通过 查询 IO 设备 的 状态 寄存 器 ， 或 等 待 一 个 中 
断 请 求 来 确定 设备 是 否 就 绪 。 但 是 这 两 种 方式 都 会 导致 相当 大 的 开销 ， 因 为 每 传递 一 个 字 大 小 
的 数据 必须 执行 好 几 条 包含 很 多 存储 器 访问 的 程序 指令 。 当 传输 一 个 数据 块 时 ， 需 要 使 用 指令 
来 增加 存储 器 地 址 和 记录 字数 。 中 断 的 使 用 涉及 操作 系统 例 程 ， 这 些 例 程 将 会 导致 由 于 保存 和 
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恢复 处 理 器 寄存 器 、 程 序 计 数 器 和 其 他 状态 信息 而 产生 的 额外 开销 。 

另 一 种 可 行 的 方法 是 直接 在 主 存 和 IO 设备 (如 磁盘 ) 之 间 传 输 数 据 块 。 该 方法 提供 了 
一 个 专门 的 控制 部 件 来 管理 传输 过 程 ， 而 不 需要 处 理 器 做 连续 干预 。 这 种 方法 被 称 为 直接 存 
储 器 访问 〈direct memory access，DMA )。 控 制 DMA 传输 的 部 件 被 称 为 DMA 控制 器 (DMA 
controller )。 它 可 能 是 IO 设备 接口 的 一 部 分 ， 或 者 也 可 能 是 一 个 被 一 些 IO 设备 共享 的 独立 部 
件 。 访 问 主 存 时 ，DMA 控制 器 执行 本 来 由 处 理 器 执行 的 功能 。 对 每 一 个 传输 的 字 ， 它 提供 存 
储 器 地 址 ， 产 生 需 要 的 所 有 控制 信号 。 它 为 连续 的 字 增 加 存储 器 地 址 并 累计 已 传输 的 字数 。 

虽然 DMA 控制 器 不 需要 处 理 器 的 参与 就 可 以 传输 数据 ， 但 它 的 操作 必须 由 处 理 器 执行 的 
程序 控制 ， 这 个 程序 通常 是 一 个 操作 系统 例 程 。 为 了 初始 化 一 个 字 块 的 传输 ， 处 理 器 必须 向 
DMA 控制 器 发 送 起 始 地 址 、 块 内 字数 和 传输 方向 等 信息 。 然 后 DMA 控制 器 就 开始 执行 所 请 
求 的 操作 。 当 整 块 数据 传输 完成 后 ， 它 产生 一 个 中 断 信号 通知 处 理 器 。 

图 8-12 显示 了 DMA 控制 器 中 的 寄存 器 ， 处 理 器 访问 这 些 寄 存 器 来 初始 化 数据 传输 操作 。 
其 中 两 个 寄存 器 用 来 存储 起 始 地 址 和 字数 。 第 三 个 寄存 器 保存 着 状态 和 控制 标志 。R/W 位 决 
定数 据 传输 的 方向 ， 当 它 被 程序 指令 置 为 1 时 ， 控 制 嚣 执行 读 操作 ， 即 将 数据 从 存储 器 传输 
到 VO 设备 。 否 则 ， 控 制 器 执行 写 操作 。 此 外 ， 处 理 器 也 会 传输 一 些 VO 设备 可 能 需要 的 额外 
信息 。 例 如 ， 就 磁盘 来 说 ， 处 理 器 会 向 磁盘 控制 器 提供 一 些 用 以 识别 数据 在 磁盘 上 位 置 的 信息 
( 对 于 磁盘 的 详细 信息 ， 请 参阅 8.10.1 节 )。 

当 控 制 器 传输 完 一 块 数据 并 准备 好 接收 另 一 个 命令 时 ， 将 Done 标志 置 1。 第 30 位 是 中 
断 允 许 标志 下 。 当 这 个 标志 被 置 为 1 时 ， 控 制 器 在 传输 完 一 块 数据 后 将 产生 一 个 中 断 。 最 后 ， 
在 请 求 中 断后 控制 器 将 IRQ 位 置 1。 

图 8-13 显示 了 如 何在 图 7-18 所 示 的 计算 机 系统 中 使 用 DMA 控制 器 。 其 中 一 个 DMA 控 
制 器 将 高 速 的 以 太 网 连接 到 计算 机 的 IO 总 线 上 (图 7-18 中 的 PCI 总 线 )。 磁盘 控制 器 控制 两 
个 磁盘 ， 同 时 具有 DMA 功能 ， 并 提供 两 个 DMA 通道 。 它 能 够 执行 两 个 独立 的 DMA 操作 ， 
就 像 每 个 磁盘 都 有 自己 的 DMA 控制 器 一 样 。 它 有 两 套 寄 存 器 来 存放 存储 器 地 址 、 字 数 等 信 
息 ， 因 此 每 个 磁盘 可 以 使 用 一 套 。 





图 8-12 ”DMA 控制 器 中 的 典型 寄存 器 图 8-13 ”DMA 控制 器 在 计算 机 系统 中 的 使 用 


要 启动 一 次 DMA 传输 ， 将 一 块 数据 从 主 存 传送 到 其 中 一 个 磁盘 ， 操 作 系 统 例 程 需要 将 地 
址 和 字数 信息 写 人 到 磁盘 控制 器 的 寄存 器 中 。DMA 控制 器 独立 执行 指定 的 操作 。 当 DMA 传 
输 完 成 后 ， 通 过 设置 Done 位 在 DMA 通道 的 状态 和 控制 寄存 器 中 记录 该 事件 。 同 时 ， 如 果 IE 
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位 被 置 位 ， 控 制 器 将 发 送 一 个 中 断 请 求 到 处 理 器 并 设置 IRQ 位 。 状 态 寄 存 器 也 可 以 用 来 记录 
其 他 信息 ， 比 如 传输 是 正确 的 还 是 错误 的 。 


8.5 存储 器 层次 结构 

我 们 已 经 说 过 ， 理 想 的 存储 器 应 该 是 高 速度 、 大 容量 和 低 价 格 的 。 从 8.2 节 的 讨论 中 我 们 
已 经 清楚 地 了 解 到 用 静态 随机 存储 器 芯片 可 以 实现 非常 快 的 存储 器 。 但 是 这 些 芯片 不 适合 用 来 
实现 大 容量 的 存储 器 ， 因 为 它们 的 基本 单元 大 小 及 功 耗 都 比 动态 随机 存储 器 的 单元 要 大 。 

虽然 动态 存储 器 部 件 可 以 用 合理 的 成 本 实现 数 千 兆 字 节 的 容量 ， 但 是 可 提供 的 容量 与 有 
庞大 数据 的 大 程序 要 求 相 比 还 是 很 小 的 。 一 个 解决 办 法 是 使 用 辅助 存储 设备 来 提供 所 需 的 存储 
器 空间 ， 这 种 辅助 存储 设备 主要 是 磁盘 。 磁 盘 可 以 用 合理 的 成 本 得 到 ， 而 且 它 们 在 计算 机 系统 
中 被 广泛 地 使 用 ， 但 要 比 半导体 存储 器 部 件 慢 得 多 。 总 的 来 说 ， 划 算 的 海量 存储 可 以 由 磁盘 来 
提供 。 一 个 容量 较 大 、 速 度 相当 快 但 价格 合理 的 主 存 使 用 动态 随机 存储 器 技术 来 构建 。 价 格 更 
贵 、 速 度 更 快 的 静态 随机 存储 器 技术 用 在 更 小 的 部 件 中 ， 这 些 部 件 中 速度 极其 重要 ， 例 如 高 速 
缓存 。 

所 有 这 些 不 同类 型 的 存储 器 部 件 都 有 效 地 
在 计算 机 系统 中 使 用 ， 计 算 机 的 整个 存储 器 可 
以 看 作 在 图 8-14 中 描述 的 分 层 结构 。 最 快 的 访 ”容量 增加 
问 是 对 保存 在 处 理 器 寄存 器 中 数据 的 访问 ， 因 
此 ， 如 果 把 处 理 器 寄存 器 看 作 存 储 器 层次 结构 
的 一 部 分 的 话 ， 那 么 就 访问 速度 而 言 ， 处 理 器 
寄存 器 位 于 最 顶端 。 当 然 ， 寄 存 器 只 提供 了 所 
需 存 储 器 的 一 个 很 小 部 分 。 

层次 结构 中 的 下 一 层 是 一 个 相对 来 说 容 
量 较 小 的 存储 器 ， 它 可 以 直接 在 处 理 器 芯片 
内 部 实现 。 这 个 存储 器 被 称 为 处 理 器 高 速 缓 
存 (processor cache )， 用 来 保存 存储 在 外 部 更 
大 存储 器 中 的 指令 和 数据 的 副本 。 高 速 缓存 的 
概念 在 1.2.2 节 中 介绍 ， 在 8.6 节 中 有 详细 的 分 
析 。 通 常 有 两 级 或 两 级 以 上 的 高 速 缓存 。 主 高 速 缓存 总 是 放 在 处 理 器 芯片 内 部 ， 这 个 高 速 组 
存 很 小 ， 其 访问 时 间 是 可 以 跟 处 理 器 寄存 器 相 比 的 。 主 高 速 缓存 被 称 为 一 级 (L1 ) 高 速 缓存 。 
一 个 更 大 的 、 速 度 有 点 慢 的 辅助 高 速 缓存 放 在 主 高 速 缓存 和 其 余 存 储 器 之 间 ， 它 被 称 为 二 级 
(L2 ) 高 速 缓存 ， 通 常 二 级 高 速 缓存 也 被 放置 在 处 理 器 芯片 内 部 。 

有 些 计算 机 除了 一 级 和 二 级 高 速 缓存 外 ， 还 有 一 个 容量 更 大 的 三 级 (1L3 ) 高 速 缓存 。 三 
级 高 速 缓 存 也 是 用 SRAM 技术 实现 的 ， 它 跟 处 理 器 和 一 级 、 二 级 高 速 缓存 可 能 在 同一 个 芯片 
中 ,也 可 能 不 是 。 

层次 结构 中 再 往 下 一 层 是 主 存储 器 ( main memory )， 这 是 用 动态 存储 器 部 件 实现 的 一 个 
很 大 的 存储 器 ， 通 常 组 装 成 存储 器 模块 的 形式 ， 比 如 8.2.5 节 中 描述 的 DIMM。 主 存 比 高 速 组 
存 大 很 多 ， 但 是 也 要 慢 得 多 。 在 一 台 处 理 器 时 钟 为 2GHz 或 更 高 的 计算 机 中 ， 主 存 的 访问 时 间 
比 一 级 高 速 缓存 的 访问 时 间 长 达 100 倍 。 

磁盘 设备 提供 廉价 的 大 容量 存储 ， 它 们 被 广泛 用 作 计 算 机 系统 中 的 辅助 存储 。 与 主 存 相 
比 ， 它 们 是 非常 慢 的 。 它 们 代表 存储 器 层次 结构 中 的 最 底层 。 


每 位 的 
速度 增加 成 本 增加 





图 8-14 存储 器 层次 结构 
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在 程序 执行 期 间 ， 存 储 器 访问 速度 是 至 关 重 要 的 。 管 理 图 8-14 中 分 层 存储 器 系统 操作 的 
关键 是 把 即将 要 使 用 的 指令 和 数据 放 到 离 处 理 器 尽 可 能 近 的 地 方 ， 这 是 使 用 我 们 接 下 来 要 讨论 
的 高 速 缓存 的 主要 目的 。 


8.6 高 速 缓存 


高 速 缓存 是 一 个 很 小 的 但 速度 很 快 的 存储 器 ， 它 被 插入 到 处 理 器 和 主 存 之 间 。 它 的 目标 
是 使 主 存 对 处 理 器 而 言 比 实际 上 表现 得 更 快 一 些 。 这 种 方法 的 有 效 性 是 以 计算 机 程序 的 引用 局 
部 性 ( locality of reference ) 特征 为 基础 的 。 对 程序 的 分 析 显 示 它 们 大 部 分 的 执行 时 间 花 在 例 程 
中 ， 其 中 有 很 多 指令 被 重复 执行 。 这 些 指令 可 能 包括 一 个 简单 的 循环 、 艇 套 的 循环 或 一 些 反复 
互相 调用 的 过 程 。 指 令 序列 的 具体 模式 并 不 重要 ， 关 键 是 在 一 段 时 间 内 程序 局 部 区 域 的 很 多 指 
令 被 反复 执行 。 这 种 行为 表现 在 两 个 方面 : 时 间 和 空间 上 。 时 间 方面 意味 着 最 近 执 行 的 指令 可 
能 很 快 又 被 执行 到 ， 而 空间 方面 意味 着 与 最 近 执 行 指令 邻近 的 指令 也 可 能 很 快 被 执行 到 。 

从 概念 上 说 ， 高 速 缓存 的 操作 非常 简单 。 存 储 器 控制 电路 利用 引用 局 部 性 特征 而 设计 。 
时 间 局 部 性 指出 只 要 信息 项 ( 指令 或 数据 ) 是 第 一 次 需要 ， 那 么 它 就 应 该 被 放 人 高 速 缓存 ， 因 
为 可 能 很 快 又 需要 它 。 空 间 局 部 性 指出 不 要 每 次 只 从 主 存 中 取 一 项 放 到 高 速 缓 在 中 ， 取 邻近 
地 址 中 的 多 个 项 是 很 有 用 的 。 术 语 高 速 缓存 块 ( cache block ) 是 指 一 定 大 小 的 一 组 邻近 地 址 单 
元 。 男 一 个 经 常用 来 指明 高 速 缓存 块 的 术语 是 高 速 缓存 行 (cache line )。 

考虑 图 8-15 中 的 简单 布局 。 当 处 理 器 发 出 一 个 
读 请 求 时 ， 包 含 指定 单元 的 一 块 存 储 器 字 的 内 容 被 
传 到 高 速 缓存 。 随 后 ， 当 程序 引用 这 个 块 中 的 任何 
单元 时 ， 所 需 内 容 直 接 从 高 速 缓存 中 读 取 。 通 常 高 
速 缓 存在 给 定时 刻 能 保存 合理 数量 的 块 ， 但 这 个 块 
数 与 主 存 中 所 有 的 块 数 相 比 还 是 要 小 得 多 。 主 存 块 
与 高 速 缓存 块 的 对 应 关系 由 映射 功能 ( mapping function ) 指定 。 当 高 速 缓存 已 经 满 了 ， 而 且 
高 速 缓存 外 的 一 个 存储 器 字 ( 指令 或 数据 ) 被 引用 时 ， 高 速 缓存 控制 硬件 必须 决定 移出 哪 一 个 
块 ， 为 包含 所 引用 字 的 新 块 腾 出 空间 。 做 出 这 种 决定 的 规则 集合 构成 了 高 速 缓存 的 蔡 换 算法 
( replacement algorithm )。 

1， 高 速 缓存 命中 

处 理 器 不 需要 明确 地 知道 高 速 缓存 的 存在 ， 它 简单 地 使 用 指向 存储 单元 的 地 址 发 出 读 写 
请 求 。 高 速 缓存 控制 电路 判断 所 请 求 的 字 当 前 是 否 存在 于 高 速 缓存 中 。 如 果 在 ， 那 么 读 或 写 
操作 直接 对 恰当 的 高 速 缓存 单元 执行 ， 这 时 称 为 发 生 了 读 或 写 命 中 (read or write hit )。 当 一 个 
读 操作 在 高 速 缓存 中 命中 时 ， 就 不 会 涉及 主 存 。 对 于 写 操作 ， 系 统 可 以 按 两 种 方法 之 一 来 处 
理 。 第 一 种 技术 称 为 直接 写 ( write-through ) 协议 ， 高速 缓存 单元 和 主 存单 元 都 更 新 。 第 二 种 
技术 只 更 新 高 速 缓存 单元 ， 并 将 包含 该 单元 的 块 打 上 一 个 关联 的 标志 位 ， 这 个 标志 位 称 为 脏 位 
( dirty bit ) 或 修改 位 ( modified bit )。 这 个 字 的 主 存单 元 将 在 以 后 更 新 ， 它 的 更 新 是 在 当 包 含 这 
个 标记 字 的 块 为 新 块 腾 出 空间 而 被 移出 高 速 缓存 时 进行 的 。 这 个 技术 被 称 为 写 回 (write-back 
或 copy-back ) 协议 。 

直接 写 协议 比 写 回 协议 简单 ， 但 是 当 一 个 给 定 的 高 速 缓存 字 在 高 速 缓存 期 间 被 多 次 更 新 
时 ， 直 接 写 会 造成 对 主 存 的 不 必要 的 写 操作 。 写 回 协议 也 可 能 包含 不 必要 的 写 操作 ， 因 为 当 这 
个 块 在 高 速 缓存 中 时 即使 只 有 一 个 字 被 修改 过 ， 那 么 块 中 所 有 的 字 最 终 都 会 被 写 回 。 写 回 协议 
是 最 常用 的 ， 它 利用 了 数据 块 能 被 高 速 传输 到 存储 器 芯片 的 优势 。 


图 8-15 高 速 缓存 的 使 用 
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2.， 高速 缓存 失效 

对 一 个 不 在 高 速 绥 存 中 的 字 进 行 读 操作 ， 会 造成 一 次 读 失效 ( read miss )。 它 将 使 得 包含 
所 请 求 字 的 那个 块 从 主 存 拷 贝 到 高 速 缓 存 中 。 整 个 块 装 进 高 速 缓存 后 ， 所 请 求 的 这 个 字 传 送 给 
处 理 器 。 一 种 替代 的 方法 是 字 一 旦 从 主 存 中 读 出 ， 就 立刻 送 到 处 理 器 中 。 后 一 种 方法 称 为 直接 
装 入 (load-through ) 或 时 重启 (early restart )， 它 在 一 定 程度 上 减少 了 处 理 器 等 待 的 时 间 ， 但 
却 以 更 复杂 的 电路 为 代价 。 

在 一 台 使 用 直接 写 协议 的 计算 机 中 发 生 写 失 效 (write miss ) 时 ， 信 息 会 直接 写 入 主 存 。 
对 于 写 回 协议 ， 包 含 所 寻 址 的 字 的 块 首先 被 装 入 高速 缓 存 ， 然 后 高 速 缓存 中 对 应 的 字 再 被 新 信 
息 覆 盖 。 

回顾 一 下 6.7 节 中 描述 的 流水 线 处 理 器 中 的 资源 限制 可 能 会 导致 指令 的 执行 被 暂停 一 个 或 
几 个 周期 。 如 果 一 条 Load 或 Store 指令 请 求 访 问 存储 器 中 的 数据 ， 而 同时 要 提取 随后 的 一 条 
指令 时 ， 就 会 发 生 这 种 情况 。 当 发 生 这 种 情况 时 ， 指 令 的 提取 将 被 延迟 ， 直 到 数据 访问 操作 完 
成 为 止 。 为 了 避免 暂停 流水 线 ， 许 多 处 理 器 使 用 独立 的 指令 和 数据 高 速 缓存 ， 这 使 得 这 两 种 操 
作 可 以 并 行进 行 。 


8.6.1 映射 功能 

有 几 种 用 于 确定 存储 器 块 被 放 人 高 速 缓存 中 哪个 位 置 的 方法 ， 这 里 将 使 用 一 个 具体 的 小 
例子 来 描述 这 些 方法 。 考 虑 一 个 包含 128 个 块 的 高 速 缓存 ， 每 个 块 有 16 个 字 ， 总 容量 是 2048 
(2K ) 个 字 。 假 设 主 存 用 16 位 地 址 编 址 。 主 存 有 64K 个 字 ， 我 们 把 它 看 作 4K 个 16 个 字 的 
块 。 为 简便 起 见 ， 假 设 连续 的 地 址 对 应 连续 的 字 。 

1. 直接 映射 

决定 主 存 块 在 高 速 缓存 中 位 置 的 最 简单 方法 是 直接 映射 (directmapping ) 技术 。 在 这 项 
技术 中 ， 主 存 块 j 映射 到 高 速 缓存 中 j 模 128 的 块 上 ， 如 图 8-16 中 所 示 。 这 样 ， 只 要 是 第 0、 
128、256、… 个 主 存 块 要 被 装 人 高 速 绥 存 ， 它 们 都 被 存储 在 高 速 绥 存 的 第 0 块 ， 第 1、129、 
257、… 个 主 存 块 都 被 存储 在 高 速 缓存 的 第 1 块 ， 依 次 类 推 。 因 为 多 个 主 存 块 被 映射 到 一 个 指 
定 的 高 速 缓存 块 位 置 ， 所 以 即使 高 速 缓存 没有 满 ， 在 该 位 置 上 也 可 能 引起 冲突 。 例 如 ， 一 个 程 
序 的 指令 可 能 从 第 1 块 开始 ， 接 着 可 能 在 一 个 转移 语句 后 跳 到 第 129 块 。 当 这 个 程序 执行 时 ， 
这 两 个 块 都 被 传输 到 高 速 缓存 的 第 1 块 。 可 以 通过 允许 新 块 覆盖 已 存在 的 块 来 解决 这 种 冲突 。 

使 用 直接 映射 技术 ， 其 替换 算法 的 价值 是 不 大 的 。 一 个 块 在 高 速 缓存 中 的 放置 由 其 主 存 
地 址 决定 ， 主 存 地 址 可 以 分 成 三 个 字段 ， 如 图 8-16 所 示 。 低 4 位 从 16 个 字 的 块 中 选择 一 个 
字 。 当 新 块 进入 高 速 缓存 的 时 候 ,，7 位 的 高 速 缓存 块 字 段 决定 这 个 块 存 人 高 速 缓存 中 哪个 位 置 。 
块 的 主 存 地 址 的 高 5 位 存储 在 与 它 在 高 速 缓存 中 的 位 置 相 关联 的 5 个 标志 ( tag ) 位 中 。 标 志 
位 用 来 确定 映射 到 这 个 位 置 的 32 个 主 存 块 中 哪 一 块 当前 正在 高 速 缓存 中 。 在 执行 过 程 中 ， 由 
处 理 器 产生 的 每 个 地 址 的 7 位 高 速 缓存 块 字 段 指 向 高 速 缓 存 中 特定 的 块 位 置 。 地 址 的 高 5 位 和 
与 高 速 缓存 位 置 相关 联 的 标志 位 做 比较 。 如 果 匹 配 ， 那 么 所 需 的 字 就 在 那个 高 速 缓存 块 中 ; 如 
果 不 匹 配 ， 则 包含 所 需 字 的 块 必须 首先 从 主 存 中 读 出 并 装 人 高 速 缓存 中 。 直 接 映射 技术 很 容易 
实现 ， 但 是 不 是 很 灵活 。 

. 2. 相 联 映射 

图 8-17 给 出 了 一 种 最 灵活 的 映射 方法 ， 通 过 它 可 以 把 主 存 块 放 置 到 高 速 缓存 中 任何 一 个 
位 置 上 。 在 这 种 情况 下 ， 当 一 个 主 存 块 在 高 速 缓存 中 的 时 候 ， 需 要 12 个 标志 位 去 标记 它 。 从 
处 理 器 接收 的 地 址 中 的 标志 位 与 高 速 缓存 中 每 个 块 的 标志 位 做 比较 ， 看 所 需要 的 块 是 否 存在 。 
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这 被 称 为 相 联 映射 (associative-mapping ) 技术 ， 它 可 以 完全 自由 地 选择 在 哪个 高 速 缓存 位 置 
上 放置 主 存 块 ， 从 而 可 以 更 有 效 地 利用 高 速 缓存 的 空间 。 当 一 个 新 块 需要 放 人 高 速 缓存 时 ， 只 
有 高 速 缓存 满 了 时 它 才 替换 出 一 个 已 存在 的 块 。 在 这 种 情况 下 ， 需 要 一 个 算法 选择 出 哪个 块 将 
要 被 换 出 。 这 里 有 多 种 替换 算法 进行 选择 ， 我 们 将 在 8.6.2 节 中 讨论 。 相 联 映射 高 速 缓存 的 复 
杂 性 比 直接 映射 高 速 缓存 的 要 高 ， 因 为 它 需要 检索 所 有 128 个 标志 的 值 ， 以 判断 给 定 的 块 是 
否 在 高 速 缓存 中 。 为 了 避免 长 时 间 的 延迟 ， 标 志 必 须 被 并 行 地 检索 。 这 种 检索 被 称 为 相 联 检索 


( associative search )。 


主 存储 器 


高 速 缓存 





人 5 
Et 


图 8-16 直接 映射 高 速 缓存 


3， 组 相 联 映射 

另 一 种 方法 可 以 将 直接 映射 技术 和 相 联 映射 技术 结合 起 来 使 用 。 高 速 缓存 的 块 被 分 成 组 ， 
这 种 映射 允许 主 存 块 可 以 位 于 特定 组 中 的 任何 一 个 块 中 。 这 样 ， 放 置 块 时 可 以 有 多 个 选择 ， 从 
而 使 直接 映射 方法 的 冲突 问题 得 到 缓解 。 同 时 ， 通 过 减少 相 联检 索 的 大 小 可 以 降低 硬件 成 本 。 
图 8-18 给 出 了 一 个 组 相 联 映射 ( set-associative-mapping ) 技术 的 例子 ， 其 中 高 速 缓存 中 每 个 组 
有 两 个 块 。 这 样 ， 第 0、64、128、…、4032 个 主 存 块 映射 到 高 速 缓存 的 第 0 组 ， 它 们 可 以 占 
用 这 个 组 的 两 个 位 置 中 的 任意 一 个 。 有 64 个 组 时 ， 就 意味 着 地 址 中 的 6 位 组 字段 决定 高 速 组 
存 中 的 哪个 组 可 能 包含 所 需 的 块 。 然 后 地 址 中 的 标志 字段 与 这 个 组 中 两 个 块 的 标志 做 相 联 比 
较 ， 以 检查 所 需要 的 块 是 否 存在 。 这 种 两 路 相 联 检索 实现 起 来 很 简单 。 
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图 8-17 相 联 映射 高 速 缓存 
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图 8-18 每 组 两 个 块 的 组 相 联 映射 高 速 缓存 
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每 组 的 块 数 可 以 作为 一 个 参数 ， 根 据 特定 计算 机 的 需求 进行 选择 。 对 于 图 8-18 中 的 主 存 
和 高 速 缓存 的 容量 来 说 ，5 位 的 组 字段 可 以 满足 每 组 4 个 块 ，4 位 的 组 字段 可 以 满足 每 组 8 个 
块 ， 依 次 类 推 。 每 组 128 个 块 的 极端 情况 不 需要 组 字段 ， 它 对 应 全 相 联 技术 ， 有 12 个 标志 位 。 
另 一 种 每 组 只 有 一 个 块 的 极端 情况 就 是 直接 映射 方法 。 每 组 有 大 个 块 的 高 速 缓存 被 称 为 上 路 组 
相 联 高 速 缓 存 。 

4. 过 时 数据 

当 电源 第 一 次 开启 时 ， 高 速 缓存 中 不 包含 任何 有 效 的 数据 。 必 须 为 每 个 高 速 缓存 块 提供 
一 个 控制 位 ， 通常 被 称 为 有 效 位 ( valid bit )， 来 表示 那个 块 中 的 数据 是 否 是 有 效 的 。 这 个 位 不 
应 该 与 前 面 提 到 的 修改 位 或 脏 位 混淆 起 来 。 当 系统 电源 刚 接 通 时 ， 所 有 高 速 缓存 块 的 有 效 位 都 
被 置 成 0。 当 新 的 程序 或 数据 从 磁盘 装 人 主 存 时 ， 一 些 有 效 位 被 置 为 0。 使 用 DMA 机制 从 磁 
盘 传 输 到 主 存 的 数据 通常 绕 过 高 速 缓存 ， 直 接 装 入 主 存 中 。 如 果 正 在 进行 更 新 的 主 存 块 目 前 在 
高 速 缓存 中 ， 那 么 相应 高 速 缓 存 块 的 有 效 位 被 置 为 0。 随 着 程序 的 执行 ， 当 一 个 主 存 块 被 装 入 
一 个 给 定 的 高 速 缓 存 块 中 时 ， 该 高 速 缓 存 块 的 有 效 位 被 置 为 1。 处 理 器 只 在 高 速 绥 存 块 的 有 效 
位 等 于 1 时 才 从 该 高 速 缓存 块 中 提取 数据 。 按 这 种 方式 使 用 有 效 位 可 以 保证 处 理 器 不 会 从 高 速 
缓存 中 提取 过 时 ( stale ) 的 数据 。 

在 使 用 写 回 协议 的 系统 中 ,需要 采取 一 种 类 似 的 预防 措施 。 在 这 种 协议 下 ， 写 入 高 速 缓 
存 的 新 数据 不 同时 写 人 主 存 中 。 因 此 ， 主 存 中 的 数据 并 不 总 是 反映 出 对 高 速 缓存 中 的 副本 所 进 
行 的 修改 。 重 要 的 是 要 确保 主 存 中 的 这 种 过 时 数据 不 会 被 传输 到 磁盘 上 。 一 种 解决 方法 就 是 转 

储 清除 (flush ) 高 速 缓存 ， 在 执行 传输 操作 之 前 迫使 所 有 的 脏 块 都 写 回 到 主 存 中 。 操 作 系 统 可 

以 通过 在 初始 化 传输 数据 到 磁盘 的 DMA 操作 之 前 发 送 一 条 命令 给 高 速 绥 存 来 做 到 这 一 点 。 转 
储 清除 高 速 缓存 对 性 能 的 影响 并 不 大 ， 因 为 这 样 的 磁盘 传输 发 生 的 频率 不 高 。 保 证 两 个 不 同 的 
实体 ( 这 里 指 处 理 器 和 DMA 子 系统 ) 使 用 相同 数据 备份 的 需求 被 称 为 高 速 缓存 一 致 性 〈cache- 


coherence ) 问题 。 


8.6.2 ”替换 算法 


在 直接 映射 高 速 缓存 中 ， 每 个 块 的 位 置 是 由 它 的 地 址 事先 决定 的 ， 因 此 替换 策略 是 没有 
价值 的 。 在 相 联 和 组 相 联 高 速 缓存 中 存在 一 定 的 灵活 性 。 当 一 个 新 块 需要 放 人 高 速 缓存 而 所 有 
它 可 能 占用 的 位 置 都 已 经 满 了 时 ， 高 速 缓存 控制 器 必须 决定 哪 一 个 原 有 的 块 将 被 覆盖 。 这 是 一 
个 很 重要 的 问题 ， 因 为 这 个 决定 是 系统 性 能 的 决定 性 因素 。 通 常 ， 我 们 的 目标 是 将 那些 最 近 可 
能 会 被 引用 的 块 保 留 在 高 速 缓存 中 。 0 个 高 速 缓 存 块 将 被 引用 并 不 是 一 件 容易 的 
事 。 程 序 的 引用 局 部 性 特征 为 找 出 一 个 合理 的 策略 提供 了 线索 。 因 为 程序 的 执行 通常 在 一 个 局 
部 区 域内 保留 相当 长 的 时 间 ， tee tor te 因此 ， 如 果 有 
一 个 块 要 被 覆盖 ， 那 么 覆盖 最 长 时 间 没 有 被 访问 的 那个 块 是 比较 合理 的 。 这 个 块 被 称 为 最 近 最 
少 使 用 (1least recently used，LRU ) 的 块 ， 这 项 技术 被 称 为 LRU 替换 算法 (LRU replacement 
algorithm )。 

要 使 用 LRU 算法 ， 高 速 缓存 控制 器 必须 在 进行 计算 的 过 程 中 跟踪 所 有 块 的 引用 情况 。 假 
设 需要 在 每 组 四 块 的 组 相 联 高 速 缓存 中 跟踪 LRU 块 ， 可 以 为 每 个 块 使 用 一 个 2 位 的 计数 器 。 
命中 时 ， 被 引用 块 的 计数 器 被 置 成 0， 原 来 比 被 引用 块 的 计数 器 值 低 的 计数 器 都 增加 1， 其 他 
的 保持 不 变 。 当 发 生 高 速 缓存 失效 且 组 不 满 时 ， 与 从 主 存 中 装 入 的 新 块 相关 联 的 计数 器 被 置 成 
0， 所 有 其 他 计数 器 的 值 增 1。 当 发 生 高 速 缓存 失效 且 组 已 经 满 了 时 ， 计 数 器 值 为 3 的 块 被 移 
出 ， 新 块 放 到 被 移出 块 的 位 置 上 ， 并 将 它 的 计数 器 置 成 0， 其 他 三 个 块 的 计数 器 增 1。 很 容易 
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证 明 被 占用 块 的 计数 器 值 总 是 不 同 的 。 

LRU 算法 被 广泛 地 使 用 。 虽 然 它 在 很 多 访问 模式 下 表现 得 很 好 ， 但 是 在 某 些 情况 中 会 导 
致 很 差 的 性 能 。 例 如 ， 在 顺序 访问 一 个 比较 大 的 、 无 法 全 部 装 入 高 速 缓存 的 数组 元 素 时 ， 它 将 
产生 令 人 失望 的 结果 ( 参见 8.6.3 节 和 习题 8.11 )。 可 以 通过 在 决定 哪个 块 被 替换 时 引入 少量 随 
机 性 来 提高 LRU 算法 的 性 能 。 

实践 中 也 使 用 一 些 其 他 的 替换 算法 。 直 觉 上 一 个 合理 的 规则 应 该 是 当 装 人 新 块 时 从 一 个 
已 经 满 了 的 组 中 移出 最 旧 的 块 。 但 是 ， 因 为 这 个 算法 没有 考虑 高 速 缓存 块 的 最 近 访 问 情况 ， 所 
以 在 选择 最 适合 被 移出 的 块 时 通常 不 如 LRU 算法 有 效 。 最 简单 的 算法 是 随机 选择 一 个 块 覆盖 ， 
有 趣 的 是 ， 人 们 发 现 这 个 简单 的 算法 在 实践 中 非常 有 效 。 


8.6.3 映射 技术 的 例子 

现在 来 考虑 一 个 详细 的 例子 ,来 说 明 不 同 的 高 速 缓存 映 射 技术 的 效果 。 假 设 处 理 器 有 独 
立 的 指令 高 速 缓存 和 数据 高 速 缓存 。 为 了 使 例子 简单 ， 假 设 数据 高 速 缓存 只 有 能 容纳 8 块 数据 
的 空间 ， 同 时 假设 每 个 块 只 由 一 个 16 位 字 的 数据 组 成 ， 且 存储 器 是 按 字 编 址 的 ， 它 有 16 位 地 
址 (这 些 参数 在 实际 计算 机 中 并 不 真实 ， 但 是 却 可 以 让 我 们 更 清楚 地 描述 映射 技术 )。 最 后 ， 
假设 在 高 速 缓存 中 替换 块 时 使 用 LRU 替换 算法 。 

让 我 们 来 分 析 一 下 运行 下 面 程序 引起 的 数据 高 速 缓存 表 项 的 变化 : 一 个 4x 10 的 数字 阵 
列 ， 每 个 数字 占 一 个 字 ， 阵 列 存储 在 主 存单 元 7A00 到 7A27 处 (十 六 进 制 )。 这 个 阵列 A 的 
元 素 按 列 的 顺序 存储 ， 如 图 8-19 所 示 。 这 个 图 还 说 明了 不 同 高 速 缓存 映射 技术 的 标志 是 如 何 
从 存储 器 地 址 中 得 到 的 。 注 意 这 里 不 需要 像 图 8-16 到 图 8-18 那样 用 一 些 位 来 标识 块 中 的 字 ， 
因为 我 们 已 经 假设 每 个 块 中 只 有 一 个 字 。 程 序 用 A 的 第 一 行 元 素 的 平均 值 来 标准 化 这 一 行 元 
素 。 因 此 ， 我 们 需要 计算 这 一 行 元 素 的 平均 值 ， 然 后 用 这 个 平均 值 去 除 每 一 个 元 素 。 所 需要 的 
任务 可 以 表示 为 : 

A(0, i) 


A(0,D 一 一 一 一 一 一 一 一 一 1= 0 Lb ,多 
(AAO.D) /io 
疡 0 

存储 器 地 址 
(7A00) 0lll1l101000000000 
(7A01) Ohhllil0d000000001 
(7A02) 01l11l11l101000000010 
(7A03) 0 O00 0000L1l 
(7A04) 0111101000000100 
(7A24) 0111101000100100 
(7A25) 0111101000100101 
(7A26) QL1ItEQCITIOO0OTOQGLTLVO 
(7A27) 0111101000100 








1 il 

一 一 一 直接 映射 的 标志 ”一 一 = 

组 相 联 映射 的 标志 ”一 一 = 

相 联 映射 的 标志 
图 8-19 存储 在 主 存 中 的 一 个 阵列 

8-20 给 出 了 对 应 于 这 项 任务 的 程序 结构 。 我 们 使 用 变量 SUM 和 AVE 来 分 别 保存 总 和 
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与 平均 值 。 这 些 变量 ， 以 及 索引 变量 1 和 / 疡 在 计算 过 程 中 都 保存 在 处 理 器 的 寄存 器 中 。 


1.， 直接 映射 高 速 缓存 SUM :=0 
在 一 个 直接 映射 的 数据 高 速 绥 存 中 ， 高 速 缓存 内 容 的 变化 forj:=0to9 do 


SUM := SUM + A(0,J) 


如 图 8-21 所 示 。 表 中 的 各 列表 示 图 8-20 中 程序 的 两 个 循环 各 aa 
次 执行 完成 后 高 速 缓存 中 的 内 容 。 例 如 ， 第 一 个 循环 执行 完 两 pr EA ee i 

次 后 (= 1)， 高 速 缓存 中 保存 元 素 A (0, 0) 和 A (0, 1)。 这 些 元 素 A(0ii) := A(0,i)/AVG 

在 块 位 置 0 和 4 中 ， 由 地 址 的 最 低 3 位 决定 。 在 下 次 循环 中 ， end 

元 素 A (0, 0) 被 A (0, 2) 替换 ， 因 为 A (0, 2) 也 被 映射 到 相同 的 ”图 8-20 8.6.3 节 中 示例 的 任务 
块 位 置 。 注 意 ， 所 需要 的 元 素 只 被 映射 到 高 速 缓存 的 两 个 位 置 

中 ， 其 他 的 六 个 位 置 无 论 在 标准 化 任务 开始 之 前 的 内 容 是 什么 ， 都 保持 不 变 。 

第 一 个 循环 在 执行 第 九 次 和 第 十 次 期 间 (7 =8, 9 )， 元 素 A (0, 8) 和 A (0, 9) 被 装 入 高 速 缓 
存 。 第 二 个 循环 颠倒 了 元 素 的 处 理 顺序 。 这 个 循环 的 前 两 次 (i=9, 8 ) 在 高 速 缓存 中 找到 需要 
的 数据 。 当 i= 7 时 ,元素 A (0, 9) 被 A (0, 7) 替换 ; 当 i= 6 时， 元素 A (0, 8) 被 A(0, 6) 替换 ， 
依次 类 推 。 因 此 在 执行 第 二 个 循环 时 ， 八 个 元 素 都 被 替换 了 。 所 以 在 执行 这 个 任务 的 过 程 中 总 
共 只 有 两 次 命中 。 




















































es 
每 次 循环 后 数据 高 速 缓存 中 的 内 容 : 
| 
块 位 置 | 7 = 1 |7=3|7=5|7=7|7=9|; ;二 0 
0 | ACO.0) | A(02) | A(04 | ACO.6) 
十 + 
| | 
2 | 
| | + 
3 | | | | 
4 | | A(0,3) | A(0,5) | A(0,7) | A(0,9) | A(0,7) 
T Te T 
5 
6 | 直上- 























图 8-21 直接 映射 数据 高 速 缓存 的 内 容 


读者 应 该 记 住 要 在 高 速 缓存 中 为 每 个 块 保 存 标志 ， 为 保持 图 的 简单 ， 我 们 没有 在 图 中 显 
示 它 们 。 
2. 相 联 映射 高 速 缓 存 
图 8-22 显示 了 相 联 映射 高 速 缓存 情况 下 
高 速 缓存 内 容 的 变化 。 假 设 高 速 绥 存 最 开始 
是 空 的 ， 那 么 在 第 一 个 循环 的 前 八 次 循环 中 ， 
元 素 被 放 入 连续 的 块 位 置 中 。 在 第 9 次 循环 0 
(三 8 ) 中 ，LRU 算法 选择 A (0, 0) 被 A (0, 8) 
盖 。 7 循环 的 下 一 次 也 是 最 后 一 次 循环 中 ， 
元 素 A (0, 1) 被 A (0, 9) 替换 。 现 在 ,第 二 个 
循环 的 前 八 次 循环 (i = 9, 8,…, 2) 需要 的 所 有 


元 素 都 可 在 高 速 缓 存 中 找到 。 当 i= 1 时 , 需 A 
要 的 元 素 是 A (0, 1)， 所 以 它 替换 最 近 最 少 使 


| A(0.7) | | A(0,7) | | A(0,7) | | A(O,7) | 
用 的 元 素 A (0, 9)。 在 最 后 一 次 循环 中 ，A (0， 
0) 替换 A (0, 8) 。 图 8-22” 相 联 映 射 数据 高 速 缓存 的 内 容 











每 次 循环 后 数据 高 速 缓存 中 的 内 容 : 
























A(0,7) 
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这 种 情况 下 ， 当 第 二 个 循环 执行 时 ， 只 有 两 个 元 素 不 能 在 高 速 缓存 中 找到 。 在 直接 映射 
的 情况 中 ， 第 二 个 循环 执行 期 间 有 八 个 元 素 需要 重新 装 入 。 显 然 ， 相 联 高 速 缓存 受益 于 可 以 完 
全 自由 地 把 主 存 块 映射 到 高 速 缓存 中 的 任何 位 置 。 在 这 两 种 情况 下 ， 通 过 在 程序 的 第 二 个 循环 
中 逆序 处 理 元 素 可 以 更 好 地 利用 高 速 缓存 。 如 果 第 二 个 循环 处 理 元 素 的 顺序 与 第 一 个 循环 一 样 
的 话 将 会 怎样 呢 ? 考虑 这 个 问题 很 有 意思 。 使 用 直接 映射 或 LRU 算法 ， 在 第 二 个 循环 中 ， 所 
有 元 素 都 会 在 使 用 前 被 覆盖 ( 参见 习题 8.10 )。 

3， 组 相 联 映射 高 速 缓存 

在 这 个 例子 中 ， 假 设 组 相 联 数据 高 速 缓存 组 织 成 两 个 组 ， 每 组 能 保存 四 个 块 。 这 样 ， 地 
址 的 最 低 有 效 位 决定 一 个 主 存 块 映射 到 哪个 组 中 ， 但 该 主 存 块 的 数据 可 以 放 在 这 个 组 中 四 个 块 
的 任何 一 块 中 。 地 址 的 高 15 位 组 成 标志 。 = 

图 8-23 描述 了 高 速 缓存 内 容 的 变化 。 每 次 循环 后 数据 高 速 缓存 中 的 内 容 ， | 
因为 所 有 需要 的 块 都 是 偶数 的 地 址 ， 所 以 re pe pate pee TY pe 
它们 映射 到 第 0 组 中 。 在 这 种 情况 下 ， 在 | 
第 二 个 循环 执行 期 间 ， 有 六 个 元 素 被 重新 
虽然 这 是 一 个 简单 的 例子 ， 但 是 它 说 

图 














A(O.5) | A(0.5) | A(O,1) 


| A(0,2) | A(0.6) | A(0,6) | A(0.6) | A(0,2) A(0,2) | 
| 
A(0.3) | A(0,7) | A(0,7) | A(0,7) | A(0.3) | A(0,3) 


三 三 三 三 三 三 


下 i \ 




















明了 一 般 情况 下 ， 相 联 映射 性 能 最 好 ， 组 
相 联 映射 次 之 ， 直 接 映射 最 差 。 但 是 相 联 
映射 实现 代价 太 高 ， 所 以 组 相 联 映射 是 一 
种 很 好 的 折 中 的 实用 方法 。 习 8-23 ”组 相 联 映射 数据 高 速 缓存 的 内 容 


8.7 性 能 因素 

计算 机 在 商业 上 取得 成 功 的 两 个 关键 因素 是 性 能 和 成 本 ， 其 目标 是 在 给 定 的 成 本 上 获得 
最 高 的 性 能 。 衡 量 成 效 的 一 个 通用 标准 是 性 价 比 ( price/performance ratio )。 性 能 依赖 于 机 器 指 
令 能 以 多 快 的 速度 送 入 处 理 器 ， 以 及 它们 能 以 多 快 的 速度 执行 。 第 6 章 说 明了 流水 线 是 如 何 提 
高 程序 执行 速度 的 。 在 这 一 章 ， 我 们 把 重点 放 在 存储 器 子 系统 上 。 

在 8.5 节 中 描述 的 存储 器 层次 结构 源 自 于 对 更 好 性 价 比 的 探索 ， 这 个 层次 结构 的 主要 目的 
是 创建 一 个 从 处 理 器 角度 来 看 访问 时 间 短 上 且 容 量 大 的 存储 器 。 使 用 高 速 缓存 时 ， 当 所 引用 存储 
单元 的 数据 在 高 速 缓存 中 时 ， 处 理 器 能 够 快速 地 访问 指令 和 数据 。 因 此 ， 高 速 缓存 提高 性 能 的 
程度 依赖 于 所 请 求 的 指令 和 数据 能 在 高 速 缓存 中 找到 的 频繁 程度 。 在 这 一 节 中 ， 我 们 将 量化 地 
分 析 这 个 问题 。 


8.7.1 命中 率 和 失效 开销 

衡量 存储 器 体系 结构 的 具体 实现 效率 的 一 个 很 好 指标 是 在 这 个 层次 结构 的 各 个 层 上 访问 
信息 的 成 功率 。 前 面 提 到 在 高 速 缓存 中 一 次 成 功 的 数据 访问 称 为 命中 。 命 中 次 数 比 上 访问 总 次 
数 称 为 命中 率 (hit rate )， 而 失效 次 数 比 上 访问 总 次 数 称 为 失效 率 (miss rate )。 

理想 情况 下 ， 整 个 存储 器 层次 结构 对 于 处 理 器 来 说 表现 得 就 像 一 个 单独 的 存储 器 部 件 那 
样 ， 具 有 处 理 器 芯片 上 的 高 速 缓存 的 访问 速度 ， 还 具有 磁盘 的 容量 。 我 们 距离 这 个 理想 目标 有 
多 远 ， 很 大 程度 上 取决 于 层次 结构 中 不 同 层 上 的 命中 率 。 超 过 0.9 的 高 命中 率 对 于 高 性 能 计算 
机 来 说 是 必需 的 。 

失效 发 生 时 需要 采取 的 措施 会 对 性 能 产生 不 利 影响 。 由 于 把 数据 块 从 存储 器 层次 结构 中 
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的 慢 速 部 件 放 入 高 速 部 件 需 要 额外 的 时 间 ， 从 而 会 产生 性 能 开销 。 在 此 期 间 ， 处 理 器 被 暂停 以 
等 待 指令 或 数据 。 等 待 时 间 取决 于 高 速 缓存 操作 的 具体 细节 ， 例 如 ， 它 取决 于 是 否 使 用 了 直接 
装 入 法。 我 们 将 失效 发 生 时 处 理 器 所 看 到 的 总 访问 时 间 称 为 失效 开销 ( miss penalty )- 

考虑 一 个 只 有 一 级 高 速 缓存 的 系统 ， 在 这 种 情况 下 .失效 开销 几乎 全 部 由 访问 主 存 中 数 
据 块 的 时 间 组 成 。 今 hh 表示 命中 率 ，M 表示 失效 开销 ，C 表示 访问 高 速 缓存 中 的 信息 需要 的 时 
间 。 这 样 ， 处 理 器 的 平均 访问 时 间 是 

lavg = hC+(1-h)M 
下 面 的 例子 将 说 明 这 些 参数 的 值 是 如 何 影响 平均 访问 时 间 的 。 
EE 

考虑 一 台 有 以 下 参数 的 计算 机 ,访问 高 速 绥 存 和 主 存 的 时 间 分 别 为 rz 和 10r。 在 发 生 高 速 
缓存 失效 时 ， 一 个 8 个 字 的 块 从 主 存 传输 到 高 速 缓存 中 。 传 输 该 块 的 第 一 个 字 需 要 花费 10r 的 
时 间 ， 剩 下 的 7 个 字 以 每 r 秒 传输 一 个 字 的 速度 传输 。 失 效 开 销 还 包括 初始 访问 高 速 缓存 失效 
时 一 个 + 的 延迟 时 间 ， 以 及 当 数 据 块 装 和 高速 缓存 后 再 传输 其 中 的 一 个 字 给 处 理 器 所 需要 的 一 
个 + 的 延迟 时 间 ( 假设 不 采用 直接 装 和 法 )。 这 样 ， 该 计算 机 的 失效 开销 可 由 下 面 的 式 子 给 出 : 

Af=r+10r+7r+T= 19r 

假设 在 一 个 具有 代表 性 的 程序 中 30% 的 指令 需要 执行 读 写 操作 ， 这 意味 着 每 执行 100 条 
指令 会 有 130 次 存储 器 访问 。 假 设 高 速 缓存 命中 率 对 于 指令 是 0.95， 对 于 数据 是 0.9， 再 进 一 
步 假 设 读 写 访问 的 失效 开销 是 相等 的 ， 那 么 使 用 高 速 缓 存 所 带 来 的 存储 器 性 能 的 提高 可 以 按 下 
面 的 公式 粗略 估算 : 

无 高 速 缓存 时 的 时 间 _ 130 x 10r 

有 高 速 缓存 时 的 时 间 。 100(0.95r+0.05 x 197)+30(0.9r+0.1 x 197) 
这 个 结果 表明 高 速 缓存 使 得 存储 器 表现 出 来 的 速度 比 它 实 际 的 速度 快 差 不 多 五 倍 。 性 能 提高 的 
倍数 随 着 高 速 缓存 相对 于 主 存 的 速度 的 提高 而 提高 。 例 如 ， 如 果 主 存 的 访问 时 间 是 20r， 则 性 
能 提高 的 倍数 变 为 7.3。 

高 命中 率 对 于 高 速 缓 在 有 效 减 少 存储 器 访问 时 间 来 说 是 非常 重要 的 。 命 中 率 取决 于 高 速 
缓存 的 容量 、 设 计 以 及 所 执行 程序 的 指令 和 数据 访问 模式 。 考 虑 这 个 例子 中 的 高 速 缓存 与 命中 
率 为 100% 的 理想 高 速 缓存 的 相 比 效果 是 很 有 益 的 。 当 高 速 缓存 的 命中 率 为 100% 时 ， 所 有 的 
存储 器 引用 都 只 耗费 1 个 rz 的 时 间 ， 这 样 ， 由 于 高 速 缓存 失效 导致 存储 器 访问 时 间 增 加 的 估算 
由 下 式 给 出 : 

实际 高 速 缓存 时 的 时 间 ”100(0.95r+0.05 x 1975)+30(0.9r+0.1 x 197) 





4.7 





理想 高 速 缓存 时 的 时 间 、 让 -2 1 
换言之 ，100% 的 高 速 缓存 命中 率 可 以 使 得 存储 器 表现 出 来 的 速度 比 使 用 实际 的 命中 率 时 快 


两 倍 。 

如 何 才能 提高 命中 率 呢 ? 一 个 可 能 是 使 用 更 大 的 高 速 缓存 ， 但 是 这 必定 要 增加 成 本 。 另 
一 个 可 能 是 在 保持 高 速 缓存 总 容量 不 变 的 前 提 下 增加 高 速 缓存 块 的 大 小 ， 以 发 挥 空间 局 部 性 的 
优势 。 如 果 在 一 个 较 大 的 块 中 所 有 的 项 都 是 计算 中 所 需要 的 ， 那 么 最 好 是 在 一 次 失效 中 将 所 有 
这 些 项 都 装 人 高 速 缓存 ， 而 不 是 在 多 次 失效 后 分 别 装 入 ,每 次 只 装 入 一 个 较 小 的 块 。 在 块 传输 
期 间 可 获得 的 高 数据 率 是 这 个 优势 的 主要 原因 。 在 达到 一 定 的 大 小 之 前 ， 增 大 块 的 大 小 是 有 效 
的 ， 超 过 这 个 大 小 ， 命 中 率 的 提高 会 被 抵消 ， 因 为 有 些 项 还 没有 被 访问 ， 该 块 就 已 经 被 换 出 
了 。 并 且 ， 较 大 的 块 需要 较 长 的 时 间 传输 ， 因 而 增加 了 失效 开销 。 由 于 计算 机 的 性 能 受命 中 率 
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增加 的 正面 影响 ， 还 受 失效 开销 增加 的 负面 影响 ， 因 此 块 的 大 小 既 不 能 太 小 也 不 能 太 大 。 在 实 
际 中 ， 最 常用 的 块 大 小 范围 是 16 字 节 到 128 字 节 。 

最 后 ， 我 们 注意 到 如 果 在 新 块 装 人 高 速 缓存 时 使 用 直接 装 人 法 ,那么 失效 开销 可 以 降低 。 
这 样 ， 所 需要 的 字 一 旦 被 装 人 高 速 缓存 处 理 器 就 可 以 重新 开始 执行 ， 而 不 是 必须 等 待 整个 块 伟 


输 完 毕 。 


8.7.2 ”处 理 器 芯片 上 的 高 速 缓存 

当 信息 在 不 同 的 芯片 间 传 输 时 ， 芯 片上 的 驱动 器 和 接收 器 会 产生 不 可 忽略 的 延迟 。 所 以 
最 好 在 处 理 需 芯片 上 实现 高 速 缓存 。 大 多 数 处 理 器 芯片 包括 至 少 一 个 一 级 (L1 ) 的 高 速 缓存 。 
通常 使 用 两 个 独立 的 一 级 (L1 ) 高 速 缓存 ， 一 个 用 于 指令 ， 另 一 个 用 于 数据 。 

在 高 性 能 处 理 器 中 ， 通常 使 用 两 级 高 速 缓存 ， 独 立 的 一 级 (LI ) 指令 高 速 缓存 和 数据 高 
速 缓存 ， 还 有 一 个 更 大 的 二 级 (L2 ) 高 速 缓存 。 这 些 高 速 缓存 通常 在 处 理 器 芯片 上 实现 。 在 
这 种 情况 中 ， 一 级 高 速 缓存 的 速度 必须 很 快 ， 因 为 它们 决定 了 处 理 器 所 能 看 到 的 存储 器 访问 时 
间 。 二 级 高 速 缓存 可 以 慢 一 些 ,但 是 它 应 该 比 一 级 高 速 缓存 大 得 多 ， 以 保证 高 命中 率 。 它 的 速 
度 不 是 那么 关键 ， 因 为 它 只 影响 一 级 高 速 缓存 的 失效 开销 。 一 台 典 型 的 计算 机 可 能 有 容量 为 数 
十 KK 字 节 的 一 级 高 速 缓存 和 数 百 K 字 节 其 至 数 兆 字 节 的 二 级 高 速 缓存 。 

包含 一 个 二 级 高 速 缓 存 能 进一步 减 小 主 存 速 度 对 计算 机 性 能 的 影响 。 可 以 观察 到 ， 二 乡 
高 速 缓存 的 平均 访问 时 间 是 任何 一 个 一 级 高 速 缓存 的 失效 开销 ， 我 们 以 此 来 评估 二 级 高 速 缓存 
的 效果 。 为 简单 起 见 ， 我 们 将 假设 指令 和 数据 的 命中 率 是 相等 的 。 因 此 ， 在 这 种 系统 中 ， 处 理 
器 的 平均 访问 时 间 是 : 

fave = hiCi+ (1—h )( hsC2 + (1—hs) M ) 
其 中 ， 

hh 是 一 级 高 速 缓存 的 命中 率 ; 

h, 是 二 级 高 速 缓存 的 命中 率 ; 

Ci 是 一 级 高 速 缓存 的 信息 访问 时 间 ; , 

C, 是 将 信息 从 二 级 高 速 缓存 传输 到 一 个 一 级 高 速 缓存 的 失效 开销 ; 

M 是 将 信息 从 主 存 传输 到 二 级 高 速 缓存 的 失效 开销 。 | 
在 处 理 器 对 存储 器 的 所 有 引用 中 ， 二 级 高 速 缓存 的 失效 次 数 由 (1 有 ) (1- 户 ) 给 出 。 如 果 加 和 
h 都 是 在 高 于 90% 这 个 范围 内 ， 那 么 二 级 高 速 缓存 的 失效 次 数 将 小 于 所 有 存储 器 访问 次 数 的 
1%。 这 使 得 M 的 值 以 及 主 存 的 速度 都 不 那么 重要 了 。 对 这 个 问题 的 定量 分 析 参 见习 题 8.14。 


8.7.3 其 他 改进 

除了 刚才 讨论 的 主要 设计 问题 ， 还 存在 其 他 几 种 改进 性 能 的 可 能 性 。 在 这 一 节 我 们 将 讨 
论 其 中 三 种 。 

1.， 写 缓冲 区 

当 使 用 直接 写 协议 时 ， 每 个 写 操作 导致 一 个 新 数据 被 写 人 主 存 。 如 果 处 理 器 必须 等 待 存 
储 咒 功能 完成 ， 像 我 们 之 前 假设 的 那样 ， 那 么 所 有 的 写 请 求 会 导致 处 理 器 变 慢 。 但 是 处 理 器 通 
常 并 不 需要 立即 访问 写 操作 的 结果 ， 所 以 它 不 必 等 待 写 请 求 的 完成 。 为 了 提高 性 能 ， 可 以 引入 
一 个 写 缓冲 区 (write buffer ) 来 临时 保存 写 请 求 。 处 理 器 把 每 个 写 请 求 放 到 这 个 缓冲 区 中 ， 然 
后 继续 执行 后 面 的 指令 。 当 存储 器 没有 可 响应 的 读 请 求 时 ， 就 把 保存 在 写 缓冲 区 中 的 写 请 求 发 
给 主 存 。 快 速 处 理 读 请 求 是 很 重要 的 ， 因 为 在 接收 到 从 存储 器 中 读 取 的 数据 前 ， 处 理 器 通常 不 
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能 继续 执行 。 因 此 ， 这 些 请 求 的 优先 级 比 写 请 求 高 。 

写 缓 冲 区 可 以 保存 一 定数 量 的 写 请 求 ， 因 此 ， 后 面 的 读 请 求 引 用 的 数据 可 能 仍 在 写 缓 冲 
区 中 。 为 了 保证 正确 的 操作 ， 从 存储 器 中 读 取 的 数据 的 地 址 总 是 要 与 写 缓冲 区 中 数据 的 地 址 做 
比较 ， 如 果 匹 配 ， 就 使 用 写 缓冲 区 中 的 数据 。 

如 果 使 用 写 回 协议 ,会 发 生 类 似 的 情况 。 这 时 ， 处 理 器 发 出 写 命令 对 高 速 缓存 中 的 字 进 
行 写 。 当 读 失效 导致 新 的 数据 块 被 放 人 高 速 缓存 时 ， 可 能 会 替换 出 一 个 现 有 的 包含 一 些 脏 数据 
的 块 。 脏 块 必须 被 写 到 主 存 中 。 如 果 先 执行 所 需 的 写 回 操作 ， 那 么 处 理 器 在 把 新 块 读 和 高速 绥 
存 前 ， 必 须 等 待 这 个 写 回 操作 完成 。 更 精明 的 做 法 是 先 读 人 新 块 ， 这 就 需要 把 即将 从 高 速 缓存 
中 换 出 的 脏 块 临时 存储 在 写 缓冲 区 中 ， 并 且 在 读 取 新 块 时 也 一 直 保 存在 那里 。 然 后 ， 再 把 写 缓 
冲 区 中 的 内 容 写 进 主 存 。 因 而 ， 写 缓冲 区 对 于 写 回 协议 也 是 有 效 的 。 

2. 预 取 

在 前 面 讨论 的 高 速 缓存 机 制 中 ， 我 们 假设 新 数据 在 第 一 次 需要 时 被 装 人 高 速 缓存 。 读 失 
效 后 ， 处 理 器 必须 暂停 ， 直 到 新 数据 到 达 ， 这 样 就 引发 了 失效 开销 。 

为 了 避免 处 理 器 暂停 ， 可 以 在 需要 数据 之 前 把 它们 预 取 到 高 速 缓存 中 。 实 现 这 一 点 的 最 
简单 方法 是 使 用 软件 。 处 理 器 的 指令 集中 可 能 提供 一 条 特殊 的 预 取 ( prefetch ) 指令 。 执 行 这 
条 指令 将 使 得 被 寻 址 的 数据 被 装 入 高 速 缓存 ， 就 像 读 失效 时 的 情况 一 样 。 在 程序 中 插入 预 取 指 
令 ， 使 得 数据 在 程序 需要 之 前 就 已 经 被 装 人 了 高 速 缓存 中 。 然 后 ， 处 理 器 将 不 必 像 读 失效 时 那 
样 等 待 引用 的 数据 。 最 好 在 处 理 器 执行 不 会 引发 读 失 效 的 指令 时 进行 预 取 ， 这 样 主 存 访 问 就 能 
与 处 理 器 运算 重 释 起 来 。 

预 取 指 令 可 以 由 程序 员 或 者 编译 器 插 和 人 到 程序 中 。 对 很 多 应 用 程序 来 说 ， 编 译 器 能 很 成 
功 地 插 和 人 这些 指 令 。 软 件 预 取 肯定 有 一 定 的 开销 ， 因 为 包含 预 取 指令 会 增加 程序 的 长 度 。 此 
外 ,一 些 预 取 操 作 可 能 会 把 那些 后 续 指令 不 用 的 数据 装 入 高 速 缓存 。 如 果 其 他 数据 引发 的 读 失 
效 把 已 预 取 的 数据 从 高 速 缓存 中 换 出 ， 这 种 情况 就 会 发 生 。 但 是 ， 软 件 预 取 对 性 能 的 总 体 效 果 
还 是 有 利 的 ， 并 且 许 多 处 理 器 都 有 支持 这 个 特性 的 机 需 指 令 。 关 于 软件 预 取 的 全 面 讨 论 见 参考 
文献 [1]。 

预 取 也 能 用 硬件 实现 ， 这 需要 使 用 试图 发 现存 储 器 引用 模式 并 根据 这 个 模式 预 取 数据 的 
电路 。 为 了 这 个 目标 已 经 提出 了 很 多 方案 ， 在 参考 文献 [2] 和 参考 文献 [3] 中 对 这 些 方案 进行 
了 描述 。 

3. 无 锁定 高 速 缓 存 

如 果 软 件 预 取 对 指令 的 正常 执行 产生 很 大 干扰 的 话 ， 就 不 会 产生 好 的 效果 。 如 果 预 取 操 
作 在 预 取 完成 前 阻止 其 他 访问 高 速 缓存 的 操作 就 会 出 现 这 样 的 情况 。 在 响应 失效 时 ， 我 们 称 高 
速 缓存 被 锁定 了 。 这 个 问题 可 以 通过 修改 高 速 缓存 的 基本 结构 来 解决 ， 允 许 处 理 器 在 高 速 缓存 
响应 失效 时 仍 能 访问 它 。 这 种 情况 下 ， 可 能 会 有 多 个 未 响应 的 失效 ， 硬 件 必 须 适 应 这 样 的 情况 
发 生 。 

能 支持 多 个 未 响应 的 失效 的 高 速 缓存 称 为 无 锁定 ( lockup-free ) 高 速 缓存 。 这 样 的 高 速 组 
存 必须 引入 用 于 跟踪 所 有 未 响应 的 失效 的 电路 。 这 可 以 通过 把 与 失效 相关 的 信息 保存 在 特定 的 
寄存 器 中 来 实现 。 无 锁定 高 速 缓存 在 20 世纪 80 年 代 早 期 最 先 用 于 由 Control Data 公司 [4] 生 
产 的 Cyber 系列 计算 机 上 。 

我 们 已 经 以 软件 预 取 为 动机 描述 了 在 读 失 效 时 不 锁定 高 速 缓存 的 必要 性 。 一 个 更 重要 的 
原因 是 在 流水 线 处 理 器 中 ， 多 条 指令 的 执行 是 重 又 的 ， 一 条 指令 引起 的 读 失 效 会 暂停 其 他 指令 
的 执行 。 无 锁定 高 速 缓存 减少 了 这 种 停顿 的 可 能 性 。 
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8.8 虚拟 存储 器 

在 大 多 数 现代 计算 机 系统 中 ， 物 理 主 存 没 有 处 理 器 的 地 址 空间 大 。 例 如 ， 一 个 产生 32 位 
地 址 的 处 理 器 有 4G 字 节 的 可 寻 址 空间 ， 而 具有 32 位 处 理 需 的 典型 计算 机 中 主 存 容 量 的 范围 
可 能 从 1G 到 4G 字 节 。 如 果 一 个 程序 还 没有 完全 装 人 主 存 ， 它 当前 未 执行 的 部 分 存放 在 辅助 
存储 设备 上 上， 通常 是 磁盘 。 因 为 程序 执行 中 需要 这 些 部 分 ， 所 以 它们 必须 预先 装 和 人 主 存 ， 可 能 
会 替换 已 经 在 主 存 中 存在 的 男 外 部 分 。 这 些 操作 由 操作 系统 使 用 一 种 称 为 虚拟 存储 器 ( virtual 
memory ) 的 方案 自动 完成 。 应 用 程序 员 不 需要 考虑 可 用 主 存 带 来 的 限制 ， 他 们 使 用 处 理 器 的 
整个 地 址 空间 来 准备 程序 。 

在 虚拟 存储 器 系统 中 ， 程 序 ， 其 实 也 就 是 处 理 器 ， 引 用 了 一 个 与 可 用 物理 主 存 空间 无 
关 的 地 址 空间 中 的 指令 和 数据 。 这 个 由 处 理 器 生成 的 指令 或 数据 的 二 进 制 地 址 称 为 虚拟 地 址 
( virtual address ) 或 逻辑 地 址 〈1logical address )。 这 个 地 址 由 硬件 和 软件 协作 转换 成 物理 地 址 。 
如 果 一 个 虚拟 地 址 引用 了 当前 位 于 物理 主 存 中 的 程序 空间 或 数据 空间 的 一 部 分 ， 那 么 主 存 中 对 
应 位 置 的 内 容 可 以 立即 被 访问 。 和 否则 ， 引 用 地 址 的 内 容 必 须 在 被 使 用 之 前 被 放 人 主 存 中 恰当 的 
位 置 上 . 

图 8-24 给 出 了 实现 虚拟 存储 器 的 典型 组 织 结构 。 一 个 称 
为 存储 器 管理 部 件 (Memory Management Unit，MMU ) 的 特 
殊 硬 件 跟踪 哪 部 分 虚拟 地 址 空间 在 物理 主 存 中 。 当 需要 的 数据 
或 指令 在 主 存 中 时 ，MMU 把 虚拟 地 址 转换 成 相应 的 物理 地 址 。 
然后 ， 所 请 求 的 存储 器 访问 按 通常 的 方式 继续 进行 。 如 果 数 据 
不 在 主 存 中 ,那么 MMU 通知 操作 系统 把 数据 从 磁盘 传送 到 主 
存 ， 这 种 传送 使 用 8.4 节 中 讨论 的 DMA 方式 进行 。 


地 址 转换 


把 虚拟 地 址 转换 成 物理 地 址 的 一 种 简单 方法 是 假设 所 有 的 
程序 和 数据 都 是 由 称 为 页 (page ) 的 固定 长 度 单 元 组 成 的 ， 每 
个 页 包含 主 存 中 连续 单元 组 成 的 一 个 字 块 。 页 的 长 度 范 围 通常 
是 从 2K 到 16K 字 节 。 当 MMU 确定 需要 进行 一 次 传送 时 ， 页 ”图 8.24 虚拟 存储 器 组 织 结构 
构成 了 在 主 存 和 磁盘 之 间 传 送信 息 的 基本 单位 。 页 不 能 太 小 ， 
因为 磁盘 的 访问 时 间 ( 几 毫 秒 ) 比 主 存 的 访问 时 间 长 得 多 ， 这 是 由 于 磁盘 需要 花费 相当 长 的 时 
间 对 数据 进行 定位 ， 一 旦 定位 ， 数 据 就 能 以 每 秒 几 兆 字 节 的 速度 传输 。 另 一 方面 ， 如 果 页 太 
大 ， 那 么 页 中 很 大 一 部 分 数据 可 能 没有 被 用 到 ， 这 些 不 需要 的 数据 会 占用 主 存 的 有 用 空间 。 

这 个 讨论 与 8.6 节 中 在 高 速 缓存 中 引入 的 概念 类 似 。 高 速 缓存 在 处 理 器 与 主 存 之 间 的 速度 
沟 睹 上 搭 起 一 座 桥 梁 ， 它 使 用 硬件 实现 ， 而 虚拟 存储 器 机 制 是 在 主 存 和 辅助 存储 设备 之 间 的 容 
量 和 速度 沟 塞 上 架 起 一 座 桥梁 ， 它 通常 部 分 地 使 用 软件 技术 实现 。 从 概念 上 看 ， 高 速 缓存 技术 
和 虚拟 存储 器 技术 非常 相似 ， 它 们 的 区 别 主 要 在 实现 细节 上 。 

基于 固定 长 度 页 的 虚拟 存储 器 地 址 转换 方法 如 图 8-25 所 示 。 处 理 器 产生 的 每 个 虚拟 地 址 ， 
不 管 是 用 于 取 指 令 还 是 存 取 操 作 数 ， 都 被 解释 成 虚拟 页 号 (virtual page number ) ( 高 地 址 位 ) 
后 边 跟 一 个 用 来 在 一 个 页 内 指定 一 个 特定 字 节 (或 字 ) 位 置 的 偏 移 量 (offset ) ( 低地 址 位 )。 
每 个 页 在 主 存 中 的 位 置信 息 保 存在 页 表 (page table ) 中 。 这 个 信息 中 包括 页 所 在 的 主 存 地 址 和 
当前 的 状态 。 主 存 中 能 保存 一 个 页 的 区 域 称 为 页 帧 (page frame )。 页 表 的 起 始 地 址 保存 在 页 表 
基 址 寄存 器 ( page table base register ) 中 。 把 虚拟 页 号 与 这 个 寄存 器 的 内 容 相 加 就 能 得 到 这 个 
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页 在 页 表 中 相应 表 项 的 地 址 。 如 果 该 页 当前 位 于 主 在 中 ， 那 么 这 个 页 表单 元 的 内 容 指 出 这 个 页 
的 起 始 地 址 。 
处 理 器 产生 的 虚拟 地 址 


页 表 基 址 寄存 器 Fr 一 





控制 位 


1 的 页 
存储 器 中 的 页 帧 贡 遇 


主 存 中 的 物理 地 址 
图 8-25 ”虚拟 存储 器 地 址 转换 


页 表 中 的 每 个 表 项 还 包含 一 些 控制 位 ， 用 来 描述 该 页 在 主 存 中 时 的 状态 。 其 中 一 个 位 表 
示 页 的 有 效 性 ， 即 这 个 页 是 否 确实 在 主 存 中 。 它 允许 操作 系统 将 一 个 页 标志 :为 无 效 ， 而 不 用 实 
际 移 除 这 个 页 。 另 一 个 位 表示 页 在 主 存 期 间 是 否 被 修改 过 。 与 高 速 缓存 一 样 ， 这 个 信息 用 于 决 
定 在 为 其 他 页 腾 出 空间 而 从 主 存 中 移出 这 个 页 之 前 是 否 需 要 把 它 的 内 容 写 回 到 磁盘 中 。 其 他 的 
控制 位 表示 对 访问 这 个 页 所 施加 的 不 同 约束 。 例 如 ， 一 个 程序 可 能 有 完全 的 读 写 权限 ， 也 可 能 
被 限制 为 只 能 进行 读 访问 。 

1. 转换 监视 缓冲 区 

MMU 在 每 一 个 读 写 访问 中 都 使 用 页 表 信 息 ， 所 以 从 理想 角度 考虑 ， 页 表 应 该 放 在 MMU 
内 部 。 不 幸 的 是 ， 页 表 可 能 很 大 。 由 于 MMU 通常 实现 为 处 理 器 芯片 的 一 部 分 ， 所 以 不 可 能 把 
整个 表 放 到 MMU 内 。 不 过 ， 可 以 将 页 表 的 一 小 部 分 拷贝 到 MMU 内 ， 而 整个 表 保 存在 主 存 
中 。 保 存在 MMU 内 部 的 这 部 分 包括 那些 最 近 访 问 的 页 所 对 应 的 表 项 。 它 们 被 保存 到 一 个 通常 
称 为 转换 监视 缓冲 区 ( Translation Lookaside Buffer，TLB ) 的 小 表 中 。TLB 对 主 存 中 的 页 表 来 
说 相当 于 一 个 高 速 缓存 ，TLB 中 的 每 个 表 项 包含 页 表 相 应 表 项 中 信息 的 副本 。 此 外 ， 它 还 包含 
页 的 虚拟 地 址 ， 为 一 个 特定 的 页 搜索 TLB 时 需要 使 用 该 虚拟 地 址 。 图 8-26 显示 了 TLB 的 一 
种 可 能 的 组 织 结构 ， 它 使 用 了 相 联 映射 技术 。 商 业 产品 中 也 有 使 用 组 相 联 映射 技术 的 TLB。 
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处 理 器 产生 的 虚拟 地 址 


(| 


i 


TB 





主 存 中 的 物理 地 址 
图 8-26” 相 联 映射 TLB 的 使 用 


接 下 来 是 地 址 转换 处 理 。 给 定 一 个 虚拟 地 址 ，MMU 在 TLB 中 搜索 引用 的 页 。 如 果 这 个 
页 的 页 表 表 项 在 TLB 中 ， 则 可 以 立即 获得 物理 地 址 。 如 果 TLB 失效 ， 那 么 就 从 主 存 中 的 页 表 
获取 所 需要 的 表 项 ， 并 同时 更 新 TLB。 
必须 保证 TLB 中 的 内 容 与 主 存 页 表 的 内 容 始终 是 相同 的 。 当 操作 系统 更 改 页 表 中 的 内 容 
时 ， 它 必须 同时 把 TLB 中 对 应 的 表 项 置 成 无 效 。TLB 中 有 一 个 控制 位 用 于 这 个 目的 。 当 一 个 
表 项 被 置 为 无 效 时 ，TLB 将 从 主 存 中 的 页 表 获 取 新 的 信息 ， 这 是 MMU 对 访问 失效 进行 响应 的 
其 中 一 个 步骤 。 
2.， 页 故障 
当 一 个 程序 发 出 访问 一 个 不 在 主 存 中 的 页 的 请 求 时 ， 我 们 说 发 生 一 次 页 故障 ( page fault )。 
必须 把 整个 页 从 磁盘 放 入 主 存 之 后 才能 对 一 个 页 进行 访问 。 当 MMU 检测 到 一 个 页 故障 时 ， 它 
通过 产生 一 个 异常 ( 中 断 ) 来 请 求 操作 系统 进行 处 理 。 这 时 ， 产 生 页 故障 的 程序 的 执行 被 中 
307| 。 断 ， 控 制 权 转移 到 操作 系统 。 操 作 系统 把 请 求 的 页 从 磁盘 拷贝 到 主 存 中 。 因 为 这 个 过 程 需要 很 
309| 长 的 延迟 ， 所 以 操作 系统 可 能 开始 执行 另 一 个 页 在 主 存 中 的 程序 。 当 页 传输 完成 后 ， 被 中 断 的 
程序 恢复 执行 。 
当 MMU 产生 一 个 中 断 来 表明 页 故障 时 ， 请 求 存储 器 访问 的 那 条 指令 可 能 已 经 被 执行 了 
一 部 分 。 必 须 保证 被 中 断 的 程序 在 恢复 执行 后 能 正确 地 继续 执行 。 这 就 有 两 种 选择 ， 被 中 断 的 
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指令 要 么 从 中 断 点 继续 执行 ， 要 么 重新 开始 。 一 个 具体 处 理 器 的 设计 决定 了 使 用 的 是 两 种 方法 
中 的 哪 一 种 。 

当主 存 已 满 的 时 候 ， 如 果 要 从 磁盘 读 出 一 个 新 的 页 ， 那 么 必须 替换 一 个 已 经 存在 的 页 。 
选择 哪个 页 被 换 出 的 问题 与 在 高 速 缓存 中 一 样 重要 ， 程 序 把 大 多 数 时 间 花 费 在 一 些 局 部 区 域 的 
规律 在 这 里 也 同样 适用 。 因 为 主 存 要 比 高 速 缓存 大 得 多 ， 所 以 应 该 能 把 程序 中 相对 更 多 的 部 分 
保存 在 主 存 中 ， 这 就 减少 了 向 或 从 磁盘 中 传输 数据 的 频率 。 与 LRU 替换 算法 类 似 的 概念 也 可 
以 用 于 页 替换 中 ， 页 表 表 项 中 的 控制 位 可 以 用 来 记录 使 用 历史 。 有 种 基于 一 个 控制 位 的 简单 方 
案 是 ， 当 相应 的 页 被 引用 ( 访问 ) 时 ， 这 个 控制 位 被 置 成 1。 操 作 系统 会 定期 地 清除 所 有 页 表 
表 项 中 的 这 个 位 ， 这 样 就 提供 了 一 个 简单 的 方法 来 判断 哪些 页 最 近 没 有 被 使 用 过 。 

一 个 修改 过 的 页 在 移出 主 存 之 前 需要 写 回 到 磁盘 中 。 注 意 在 高 速 缓存 体系 结构 中 非常 有 
用 的 直接 写 协议 不 适合 虚拟 存储 器 ， 这 一 点 很 重要 。 磁 盘 的 访问 时 间 太 长 ， 经 常 访问 它 来 写 入 
少量 的 数据 是 没有 意义 的 。 

查找 TLB 的 表 项 会 引 和 人 一 些 延迟 ， 这 减 慢 了 MMU 的 操作 。 这 里 我 们 再 利用 引用 的 局 部 
性 特征 ， 多 个 连续 的 TLB 地 址 转换 很 可 能 只 涉及 同一 个 程序 页 上 的 地 址 。 这 种 情况 在 取 指 令 
时 尤为 可 能 。 这 样 ， 我 们 可 以 将 最 近 使 用 的 TLB 表 项 保存 在 一 些 可 以 快速 访问 的 特殊 寄存 器 
中 ， 从 而 减少 地 址 转换 时 间 。 


8.9 存储 器 管理 需求 

在 对 虚拟 存储 器 概念 的 讨论 中 ， 我 们 隐 含 地 假设 只 有 一 个 大 程序 在 执行 。 如 果 不 能 把 这 
个 程序 全 部 装 入 可 用 的 物理 存储 器 中 ， 那 么 它 的 一 部 分 ( 一 些 页 ) 在 执行 时 将 从 磁盘 移 到 主 
存 中 。 虽 然 我 们 间接 地 提 到 了 管理 程序 段 移 动 所 需要 的 软件 程序 ， 但 是 并 没有 指出 它们 的 细 
节 内 容 。 

存储 器 管理 例 程 是 计算 机 操作 系统 的 一 部 分 。 将 操作 系统 例 程 集中 到 一 个 虚拟 地 址 空间 

会 很 方便 ， 这 个 空间 称 为 系统 空间 ( system space )， 它 与 用 户 应 用 程序 所 在 的 虚拟 空间 独 
立 ， 后 者 称 为 用 户 空间 ( user space )。 实 际 上 ， 可 能 存在 多 个 用 户 空 间 ， 每 个 用 户 一 个 ， 这 可 
以 通过 为 每 个 用 户 程序 提供 一 个 单独 的 页 表 来 实现 。MMU 使 用 页 表 基 址 寄存 器 来 判断 在 转换 
过 程 中 使 用 的 页 表 的 地 址 ， 因 此 ， 通 过 修改 这 个 寄存 器 的 内 容 ， 操 作 系统 就 可 以 从 一 个 空间 转 
换 到 另 一 个 空间 。 于 是 ， bt ete te 
何 给 定 的 时 刻 ， 只 有 属于 其 中 一 个 空间 的 页 能 被 访问 。 

eC mln he EE Ee 
的 问题 ， 任 何 程序 都 不 能 破坏 主 存 中 其 他 程序 的 指令 和 数据 。 保 护 可 以 通过 几 种 方法 来 提供 。 
让 我 们 首先 来 考虑 最 基本 的 保护 形式 。 大 部 分 处 理 器 可 以 在 管理 模式 ( supervisor mode ) 或 者 
用 户 模 式 ( user mode ) 下 工作 。 当 执行 操作 系统 例 程 时 ， 处 理 需 通常 处 于 管理 模式 ， 而 执行 用 
户 程序 时 ， 处 理 器 处 于 用 户 模 式 。 在 用 户 模式 下 ， 有 一 些 机 器 指令 不 能 被 执行 ， 这 些 指令 是 特 
权 指 令 (privileged instruction )， 它 们 包括 修改 页 表 基 址 寄存 器 的 指令 ， 这 种 指令 只 能 在 处 理 器 
处 于 管理 模式 时 才能 执行 。 因 为 用 户 程序 是 在 用 户 模式 下 执行 的 ， 所 以 它 就 不 能 访问 其 他 用 户 
的 页 表 或 者 系统 空间 的 页 表 。 

有 时 候 一 个 应 用 程序 要 求 访问 属于 另 一 个 程序 的 某 些 页 ， 操 作 系统 通过 使 这 些 页 在 两 个 
空间 中 都 可 见 来 实现 这 一 点 ， 因 而 这 些 共享 的 页 在 两 个 不 同 的 页 表 中 都 有 表 项 。 每 个 页 表 表 项 
中 的 控制 位 都 可 以 用 来 控制 相应 程序 的 访问 权限 。 例 如 ， 对 于 一 个 给 定 的 页 ， 一 个 程序 可 能 被 
允许 读 和 写 ， 而 另 一 个 程序 可 能 只 被 允许 读 访 问 。 
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8.10 ”辅助 存储 器 

前 面 章 节 讨论 的 半导体 存储 器 并 不 能 提供 计算 机 需要 的 全 部 存储 能 力 ， 其 主要 限制 是 每 
位 存储 信息 的 成 本 。 大 多 数 计算 机 系统 的 大 量 存储 需求 是 使 用 更 经 济 的 磁盘 和 光盘 的 形式 实现 
的 ， 它 们 通常 被 称 为 辅助 存储 设备 。 


8.10.1 磁盘 

在 磁盘 系统 中 存储 介质 是 由 安装 在 一 个 轴 上 的 一 个 或 多 个 磁盘 盘 片 组 成 。 在 每 个 盘 片上 
覆盖 着 一 层 很 薄 的 磁性 薄膜 ， 通 常 两 面 都 有 。 该 装配 放 在 一 个 能 使 它 以 恒定 的 速度 旋转 的 驱动 
器 上 。 磁 性 表面 在 读 / 写 磁头 附近 移动 ， 如 图 8-27a 所 示 。 数 据 存储 在 同心 磁道 上 ， 读 写 磁头 
沿 径 向 方向 移动 以 访问 不 同 的 磁道 。 

每 个 读 写 磁 头 包 括 一 个 磁 斩 和 一 个 磁性 线圈 ， 如 图 8-27b 所 示 。 通 过 向 磁性 线圈 施加 适当 
极 性 的 电流 脉冲 可 以 将 数字 信息 存储 到 磁性 薄膜 上 ， 这 导致 磁头 正 下 方 的 薄膜 区 域 的 磁化 方向 
与 施加 的 磁场 同 向 。 这 个 磁头 还 可 以 用 于 读 取 存储 的 信息 ， 此 时 ， 磁 性 薄膜 相 对 磁 罗 的 运动 导 
致 磁头 附近 的 磁场 发 生变 化 ， 这 会 在 磁性 线圈 中 感应 出 电压 ， 这 时 这 个 线圈 用 作 读 出 线圈 。 控 
制 电路 检测 该 电压 的 极 性 ， 以 判断 薄膜 的 磁化 状态 -在读 操 作 时 ， 只 有 磁头 下 的 磁场 发 生变 化 
才能 被 感应 到 。 因 此 ， 如 果 二 进 制 状态 0 和 1 用 两 个 相反 的 磁化 状态 表示 ， 那 么 只 有 在 位 流 中 
0 变 成 1 或 1 变 成 0 时， 磁头 才能 感应 出 电压 ， 一 长 串 的 0 或 1 只 有 在 这 个 串 的 开头 和 结尾 才能 
产生 感应 电压 。 因 此 ， 为 了 判断 所 存储 的 连续 的 0 或 1 的 个 数 ， 必 须 用 一 个 时 钟 提 供 同 步 信息 。 

在 早期 的 设计 中 ,时 钟 被 存储 在 一 个 单独 的 磁道 的 磁性 中 ， 这 个 磁道 的 磁性 在 每 个 位 周 
期 中 都 必须 改变 。 以 这 个 时 钟 信号 为 参照 ， 存 储 在 其 他 磁道 中 的 数据 就 能 被 正确 读 出 了 。 现 
代 的 方法 是 把 时 钟 信息 与 数据 结合 起 来 ， 现 在 已 经 开发 出 几 种 不 同 的 技术 用 于 这 种 编码 。 一 
种 简单 的 方案 在 图 8-27c 中 给 出 ， 它 被 称 为 相位 编码 (phase encoding ) 或 曼彻斯特 编码 
(Manchester encoding )。 在 这 种 方案 中 ， 每 个 数据 位 都 有 磁性 变化 发 生 ， 如 图 8-27 所 示 。 磁 性 
变化 可 在 每 个 位 周期 的 中 点 发 生 ， 以 此 来 提供 时 钟 信 息 。 曼 彻 斯 特 编码 的 缺点 是 它 的 位 存储 密 
度 较 低 ， 表 示 一 位 需要 的 空间 必须 足够 大 ， 以 容纳 磁性 的 两 个 变化 。 我 们 用 曼彻斯特 编码 的 例 
子 来 阐述 如 何 实 现 一 个 自 同步 时 钟 ( self-clocking ) 方案 ， 因 为 它 比 较 好 理解 。 此 外 ， 人 们 还 
开发 了 一 些 更 紧凑 的 编码 ， 它 们 更 有 效 ， 并 能 提供 更 高 的 存储 密度 ， 但 同时 也 需要 更 复杂 的 控 
制 电路 。 对 这 些 编码 的 讨论 超出 了 本 书 的 范围 。 

读 写 磁头 必须 与 转动 的 盘面 保持 一 个 很 近 的 距离 ， 以 此 来 获得 较 高 的 位 密度 和 可 靠 的 读 
写 操 作 。 当 磁盘 以 一 个 稳定 的 速度 旋转 时 ， 在 盘面 和 磁头 之 间 会 产生 一 个 空气 压力 ， 迫 使 磁头 
远离 盘面 。 这 个 力 可 以 由 一 个 弹 自 装 置 抵消 ， 这 个 装置 把 磁头 压 向 盘面 。 在 磁头 和 它 的 支撑 臂 
之 间 有 灵活 的 弹簧 连接 ， 这 人 允许 磁头 在 离开 盘面 所 需 距 离 的 位 置 上 悬 置 ， 可 以 免 受 磁盘 表 平 面 
微小 起 伏 的 影响 。 

在 多 数 现代 磁盘 部 件 中 ， 盘 体 和 读 写 磁头 被 放置 在 一 个 密封 的 、 对 空气 进行 过 滤 的 外 壳 
中 ， 这 种 方法 被 称 为 温 切 斯 特技 术 ( Winchester technology )。 在 这 样 的 部 件 中 ， 读 写 磁 头 可 以 
在 距离 磁化 轨迹 表面 更 近 的 位 置 上 工作 ， 因 为 里 面 不 存在 灰尘 微粒 ， 而 灰尘 微粒 是 未 密封 组 装 
中 的 难题 。 磁 头 离 磁 道 表 面 越 近 ， 数 据 就 能 以 越 高 的 密度 沿 着 磁道 存放 ， 磁 道 之 间 的 距离 也 就 
越 近 。 因 此 ， 在 给 定 物理 斥 寸 的 条 件 下 ， 温 切 斯 特 磁 盘 的 容量 比 未 密封 部 件 更 大 。 温 切 斯 特技 
术 的 另 一 个 优势 是 在 密封 部 件 中 ， 存 储 介质 没有 暴露 在 污染 环境 中 ， 因 而 数据 有 更 好 的 完整 性 。 

磁盘 系统 中 的 读 写 磁头 是 可 移动 的 。 每 个 盘面 有 一 个 磁头 ， 所 有 的 磁头 都 安装 在 一 个 梳 
状 支撑 臂 上 ， 这 个 支撑 臂 可 以 横 跨 磁盘 堆 径 向 移动 ， 从 而 实现 对 单个 磁道 的 访问 ， 如 图 8-27a 
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所 示 。 要 在 一 个 给 定 的 磁道 上 读 或 写 数据 ， 读 写 侯 头 必须 首先 定位 到 该 人 ”。 道 上 。 
汛 / 写 磁头 
旋转 驱动 轴 
SN 


磁化 电流 








访问 机 制 磁性 注 膜 
a) 机 械 结 构 b) 读 / 写 磁头 细节 





c) 使 用 相位 编码 表示 位 
图 8-27 磁盘 原理 
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磁盘 系统 包括 三 个 关键 部 分 。 第 一 个 部 分 是 装配 的 磁盘 盘 片 ， 通 常 称 为 磁盘 ( disk )。 第 
二 个 部 分 是 电机 装置 ， 用 来 旋转 磁盘 和 移动 读 写 磁 头 ， 这 被 称 为 磁盘 驱动 器 ( disk drive )。 第 
三 个 部 分 是 磁盘 控制 器 ( disk controller )， 它 是 控制 系统 运作 的 控制 电路 。 磁 盘 控制 器 可 以 实 
现成 一 个 单独 的 模块 ， 也 可 以 放 在 包含 整个 磁盘 系统 的 外 这 中 。 我 们 已 经 注意 到 通常 把 磁盘 驱 


动 器 与 磁盘 合 起 来 称 为 磁盘 ， 在 后 面 的 章节 中 如 果 没 有 歧义 ,我 们 也 使 用 这 种 叫 法 。 
1.， 磁盘 数据 的 组 织 结构 和 访问 


磁盘 上 数据 的 组 织 结构 如 图 8-28 所 示 ， 每 个 盘面 都 被 分 成 同心 的 磁道 ( track )， 每 个 磁道 
又 被 分 成 户 区 ( sector )。 磁 盘 堆 所 有 盘面 上 相同 磁道 的 集合 形成 逻辑 上 的 柱 面 ( cylinder ), 不 
需 移动 读 写 磁头 就 可 以 访问 一 个 柱 面 中 的 所 有 磁道 。 数 据 通过 指定 盘面 号 、 磁 道 号 和 扁 区 号 来 


访问 ， 读 写 操作 总 是 在 扇 区 边界 处 开始 。 


第 1 磁道 ,第 0 扇 区 
第 0 磁道 ,第 0 肩 区 


第 磁道 ， 第 3 扇 区 





图 8-28 ”磁盘 一 个 表面 的 结构 
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数据 位 顺序 存放 在 每 个 磁道 中 。 每 个 扇 区 可 能 包含 512 或 者 更 多 字 节 的 数据 。 数 据 的 前 
面 有 一 个 扁 区 头 〈sector header )， 它 包含 标志 ( 寻 址 ) 信息 ， 这 些 信息 用 来 在 选 定 的 磁道 上 
找到 所 需要 的 扇 区 。 在 数据 后 面 有 一 些 组 成 纠 错 码 (error-correcting code，ECC ) 的 附加 位 。 
ECC 位 用 来 检测 和 纠正 在 读 写 这 些 数 据 字 节 时 可 能 发 生 的 错误 。 扇 区 间 存 在 一 个 小 的 扇 区 间 
陈 (inter-sector gap )， 可 使 得 磁盘 控制 电路 很 容易 地 区 别 两 个 连续 的 扇 区 。 

一 个 未 格式 化 磁盘 的 磁道 上 没有 任何 信息 ， 格 式 化 过 程 将 写 人 一 些 标记 信息 ， 用 来 把 磁 
盘 分 成 磁道 和 扇 区 。 在 这 个 过 程 中 ， 磁 盘 控 制 器 可 能 会 发 现 一 些 有 缺陷 的 扇 区 甚至 整个 磁道 ， 
磁盘 控制 器 保存 这 些 缺 陷 的 记录 ， 并 在 使 用 时 排除 这 些 面 区。 格式 化 信息 包括 面 区 头 、ECC 
位 和 遍 区 间隙 。 除 掉 格 式 化 信息 的 开销 后 ， 格 式 化 磁盘 的 容量 是 磁盘 存储 容量 的 很 好 的 指标 。 
格式 化 后 ， 人 磁盘 被 分 成 逻辑 分 区 。 

图 8-28 说 明 每 个 磁道 有 相同 数目 的 扇 区 ， 这 意味 着 所 有 的 磁道 有 相同 的 存储 容量 。 在 这 
种 情况 下 ， 所 存储 的 信息 在 内 层 磁道 上 比 外 层 磁道 放 得 更 密 。 我 们 也 可 以 通过 在 周 长 更 长 的 外 
层 磁 道上 放置 更 多 的 扇 区 来 增加 存储 密度 ， 这 将 需要 使 用 更 加 复杂 的 访问 电路 。 

2， 访 问 时 间 

从 磁盘 接收 地 址 到 实际 的 数据 传输 开始 之 间 的 时 间 延 迟 包 含 两 个 部 分 。 第 一 个 部 分 称 为 
寻 道 时 间 (seek time )， 是 把 读 写 磁 头 移 动 到 恰当 磁道 所 需 的 时 间 ， 它 依赖 于 开始 时 磁头 到 该 
地 址 所 指定 磁道 的 相对 位 置 。 寻 道 时 间 的 平均 值 在 5 ~ 8 毫秒 的 范围 内 。 第 二 个 部 分 是 旋转 延 
迟 (rotational delay )， 也 称 为 等 待 时 间 (1latency time )， 它 是 将 读 写 磁头 定位 到 正确 的 磁道 后 
再 到 达 所 寻 址 的 扇 区 所 花费 的 时 间 。 平 均 起 来 ， 这 是 磁盘 转动 半 周 所 花 的 时 间 。 这 两 个 延迟 的 
总 和 被 称 为 访问 时 间 (access time )。 如 果 在 一 次 操作 中 只 有 少数 扇 区 的 数据 被 访问 ,那么 访问 
时 间 至 少 比 传输 数据 所 花费 的 时 间 高 一 个 数量 级 。 

3. 数据 缓冲 区 / 高 速 缓存 

一 个 磁盘 驱动 咒 可 以 使 用 一 些 标准 的 互 连 方案 ， 例 如 SCSI 或 SATA， 连 接 到 计算 机 系统 
的 其 他 部 分 上 上。 这些 互 连 人 硬件 传输 数据 的 速率 通常 要 比 从 磁盘 的 磁道 读数 据 的 速率 快 得 多 ， 处 
理 传输 速率 差异 的 一 个 有 效 方法 是 在 磁盘 部 件 中 引入 一 个 数据 缓冲 区 (data buffer )。 这 个 缓冲 
区 是 一 个 半导体 存储 器 ， 能 存储 几 兆 字 节 的 数据 。 所 请 求 的 数据 在 磁盘 磁道 和 缓冲 区 之 间 传 
输 ， 传 输 速率 依赖 于 磁盘 的 转速 。 然 后 在 数据 缓冲 区 和 主 存 之 间 的 传输 能 以 它们 之 间 的 互 连 所 
允许 的 最 大 速度 进行 。 

磁盘 控制 器 中 的 数据 缓冲 区 还 能 用 来 为 磁盘 提供 高 速 缓存 机 制 。 当 一 个 读 请 求 到 达 磁 盘 
时 ， 控 制 器 可 以 先 检 查 所 需要 的 数据 是 否 已 经 在 缓冲 区 中 。 如 果 在 ， 那 么 可 以 在 微 秒 级 内 将 数 
据 传输 到 存储 器 中 ， 而 不 是 毫秒 级 。 如 果 不 在 ， 那 么 使 用 通常 的 方法 把 数据 从 磁盘 磁道 上 读 
出 ， 存 入 缓冲 区 中 ， 然 后 再 传输 到 存储 器 中 。 由 于 引用 的 局 部 性 ， 后 面 的 请 求 很 可 能 会 引用 当 
前 请 求 所 指定 数据 的 后 续 数 据 。 在 对 将 来 请 求 的 预测 中 ， 磁 盘 控 制 器 可 以 读 取 比 需要 数据 更 多 
的 数据 ， 并 把 它们 放 入 缓冲 区 中 。 当 缓冲 区 用 作 高 速 缓存 时 ， 它 通常 足够 大 ， 能 放下 整个 磁道 
的 数据 ， 所 以 一 个 可 能 的 策略 是 读 写 磁头 一 定位 到 所 需 磁 道上 就 开始 将 这 个 磁道 的 内 容 传输 到 
数据 缓冲 区 中 。 

4， 磁 盘 控 制 器 

磁盘 驱动 器 的 操作 由 磁盘 控制 器 电路 控制 ， 此 外 这 个 电路 还 提供 磁盘 驱动 器 和 计算 机 系 
统 其 他 部 分 之 间 的 接口 。 一 个 磁盘 控制 器 可 以 用 来 控制 多 个 驱动 器 。 

直接 跟 处 理 器 相连 的 磁盘 控制 器 包括 可 由 操作 系统 读 写 的 多 个 寄存 器 。 于 是 操作 系统 和 
磁盘 控制 器 之 间 的 通信 可 以 使 用 与 VO 接口 相同 的 方法 实现 ， 就 像 在 第 7 章 中 讨论 的 那样 。 磁 
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盘 控 制 器 使 用 DMA 方案 在 磁盘 和 主 存 之 间 传 输 数 据 。 实 际 上 ， 数 据 是 从 或 向 数据 缓冲 区 进行 
传输 的 ， 数 据 缓冲 区 作为 磁盘 控制 器 的 一 部 分 来 实现 。 操 作 系 统 通 过 发 出 读 或 写 请 求 来 启动 
一 次 传输 ， 这 需要 把 所 需 的 寻 址 和 控制 信息 装 和 控制 器 的 寄存 器 中 , 通常， 这些 信息 包括 : 
。 主 存 地 址 : 传输 中 所 涉及 字 块 的 第 一 个 主 存单 元 的 地 址 。 
e 磁盘 地 址 : 包含 所 需 字 块 起 始 位 置 的 扇 区 单元 。 
e 字数 : 所 传输 的 块 中 的 字数 。 
操作 系统 发 出 的 磁盘 地 址 是 逻辑 地 址 ， 它 与 磁盘 上 对 应 的 物理 地 址 可 能 不 一 样 。 例 如 ， 
磁盘 在 格式 化 时 检测 到 了 坏 扇 区 ， 磁 盘 控 制 器 记录 这 些 遍 区， 维护 逻 辑 地 址 和 物理 地 址 之 间 的 
映射 关系 。 通 常 ， 在 每 个 磁道 或 同一 个 柱 面 的 其 他 磁道 中 保留 了 一 些 空闲 鹿 区 ， 用 作 坏 扇 区 的 
替代 品 。 
从 磁盘 驱动 器 的 角度 来 看 ， 控 制 器 的 主要 功能 是 : 
e 寻 道 : 使 磁盘 驱动 器 把 读 写 磁 头 从 当前 位 置 移动 到 所 需要 的 磁道 上 。 
。 读 : 初始 化 一 个 读 操 作 ， 从 磁盘 地 址 寄存 器 指定 的 地 址 开始 读 。 从 磁盘 中 顺序 读 出 的 
数据 被 组 装 成 字 ， 并 被 放 人 数据 缓冲 区 ， 用 来 向 主 存 传输 。 字 数 由 字 计 数 寄存 器 决定 。 
e。 写 : 使 用 类 似 于 读 操作 的 控制 方法 把 数据 传输 到 磁盘 上 。 
e 错误 检查 : 计算 从 指定 扇 区 所 读 出 数据 的 纠 错 码 (ECC ) 值 ， 并 将 其 与 从 磁盘 读 出 的 
相应 的 ECC 值 进行 比较 。 不 匹配 时 ， 如 果 可 能 ， 它 就 纠正 这 个 错误 ， 否 则 它 就 产生 
一 个 中 断 ， 通 知 操作 系统 发 生 了 一 个 错误 。 在 写 操作 期 间 ， 控 制 器 计算 要 写 和 人 数据 的 
ECC 值 ， 并 把 这 个 值 存 到 磁盘 上 。 
5， 软 盘 
上 面 讨论 的 磁盘 叫做 硬盘 部 件 ， 软 盘 (floppy disk ) 是 更 小 、 更 简单 、 更 廉价 的 磁盘 部 件 ， 
它 包 含 一 个 柔韧 的 可 移动 的 塑料 磁盘 ， 这 个 磁盘 覆盖 着 一 层 磁 性 材料 。 磁 盘 装 在 一 个 塑料 外 壳 
中 ， 这 个 外 壳 有 一 个 开口 ， 可 以 从 开口 处 定位 读 写 磁头 。 磁 盘 驱 动 器 的 旋转 轴 可 以 插入 磁盘 中 
心 的 一 个 孔 中 转动 磁盘 。 
软盘 的 主要 特点 是 低 成 本 ， 并 可 以 方便 地 移动 ， 但 是 与 硬盘 相 比 ， 它 们 的 存储 容量 小 得 
多 ， 访 问 时 间 更 长 ， 并 且 失 败 率 更 高 。 近 年 来 ， 它 们 已 经 大 量 地 被 CD 、DVD 和 作为 便携 式 存 
储 介质 的 闪存 卡 所 取代 。 
6，RAID 磁盘 阵列 
处 理 器 速度 已 经 显著 地 增加 ， 同 时 ， 由 于 机 械 运动 的 限制 ， 磁 盘 驱 动 器 的 访问 时 间 仍 在 
毫秒 级 。 减 少 访问 时 间 的 一 种 方法 是 使 用 多 个 磁盘 并 行 操 作 。1988 年 ， 加 州 大 学 伯克利 分 校 的 
研究 者 提出 了 这 样 一 个 存储 系统 [5]， 他 们 称 之 为 RAID， 表 示 廉 价 磁盘 匈 余 阵列 ( 因为 现在 
所 有 的 磁盘 都 很 便宜 ， 所 以 RAID 这 个 缩写 后 来 被 重新 解释 为 独立 磁盘 元 余 阵 列 ( Redundant 
Array of Independent Disk ) )。 使 用 多 个 磁盘 还 可 以 提高 整个 系统 的 可 靠 性 。 研 究 者 们 提出 了 几 
种 不 同 的 配置 结构 ， 此 后 又 开发 出 了 更 多 的 配置 结构 。 
基本 的 配置 结构 被 称 为 RAID 0， 它 是 非常 简单 的 。 一 个 大 文件 被 分 成 一 些小 块 ， 把 这 些 
小 块 存 到 不 同 的 磁盘 上 ， 从 而 实现 把 这 个 大 文件 存储 到 多 个 不 同 的 磁盘 上 ， 这 称 为 数据 条 带 化 
( data striping )。 当 对 这 个 文件 进行 读 操 作 访 问 时 ， 所 有 的 磁盘 可 以 并 行 访问 它们 的 那 部 分 数 
据 。 因 此 ， 数 据 的 传输 速率 等 于 单个 磁盘 的 数据 传输 速率 乘 以 磁盘 的 数量 ， 但 是 访问 时 间 ， 也 
就 是 用 于 在 每 个 磁盘 上 定位 数据 起 点 的 寻 道 时 间 和 旋转 延迟 并 没有 减少 。 由 于 每 个 磁盘 独立 操 
作 ， 所 以 访问 时 间 各 不 一 样 。 数 据 的 各 个 块 被 缓冲 ， 以 便 能 重组 成 完整 的 文件 ， 并 把 它 作 为 一 
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个 单一 的 实体 传送 给 存储 器 。 

各 种 不 同 的 RAID 配置 形成 一 个 层次 结构 ， 其 中 每 一 个 层次 都 提供 额外 的 特性 。 例 如 ， 
RAID 1 用 来 提供 更 高 的 可 靠 性 ， 它 把 数据 的 相同 备份 存放 到 两 个 磁盘 上 ， 而 不 只 是 一 个 磁盘 
上 。 这 两 个 磁盘 相互 被 称 为 彼此 的 镜像 。 如 果 一 个 磁盘 出 错 了 ， 所 有 的 读 写 操作 都 指向 它 的 镜 
像 。 层 次 结构 中 的 其 他 层次 通过 不 同 的 奇偶 校 验 方案 来 获得 更 高 的 可 靠 性 ， 它 们 不 需要 整个 磁 
盘 的 副本 。 其 中 一 些 还 具有 错误 恢复 能 力 。 

RAID 概念 已 经 被 商家 接受 ， 许多 制造 商都 制造 了 RAID 系统 以 用 于 各 种 操作 系统 中 。 


8.10.2 ”光盘 

存储 设备 也 可 以 使 用 光学 方法 实现 ， 人 们 熟知 的 用 于 音频 系统 的 光盘 (Compact Disk， 
CD ) 是 这 项 技术 的 第 一 个 实际 应 用 。 后 来 光学 技术 很 快 就 用 于 计算 机 环境 ， 以 提供 高 容量 的 
只 读 存 储 介质 ， 被 称 为 只 读 光盘 ( CD-ROM )。 

第 一 代 CD 在 20 世纪 80 年 代 中 期 由 索尼 和 飞利浦 公司 开发 出 来 。 这 个 技术 利用 了 可 以 使 
用 数字 来 表示 模拟 的 声音 信号 的 可 能 性 。 为 了 提供 高 质量 的 声音 记录 和 再 现 ， 人 们 使 用 了 16 
位 的 模拟 声音 信号 采样 ， 频 率 为 每 秒 采 样 44 100 次 。 最 初 ，CD 被 设计 成 可 以 保存 75 分 钟 的 
音乐 ， 这 需要 大 约 3x10 位 (3G 位 ) 的 存储 量 。 从 那 以 后 ， 更 高 容量 的 设备 被 开发 出 来 。 

1. CD 技术 

用 于 CD 系统 的 光学 技术 利用 激光 可 以 聚焦 于 一 个 很 小 的 点 上 这 一 特性 。 一 个 激光 束 直射 
到 旋转 的 光盘 上 ， 光 盘 表面 上 有 排列 成 长 螺旋 轨道 的 微小 止 痕 。 这 些 凸 痕 把 射 来 的 光束 反射 到 
一 个 光电 探测 器 上 ， 用 它 来 探测 所 存储 的 二 进 制 模式 。 

激光 器 发 出 一 束 相 十 光 ， 它 准确 地 聚焦 到 盘面 上 。 相 十 光 由 具有 相同 波长 的 同步 波 组 成 。 
如 果 一 东 相 干 光 与 男 一 束 相同 类 别 的 光 混合 ， 并 且 这 两 束 光 同 相位 ， 那 么 就 会 产生 一 东 更 亮 的 
光 。 但是， 如果 这 两 束 光 相位 差 180 度 ， 那 么 它们 会 互相 抵消 。 因 此 ， 光 电 探测 器 能 用 来 探测 
光束 ， 在 第 一 种 情况 下 它 会 看 到 一 个 亮点 ， 在 第 二 种 情况 下 它 会 看 到 一 个 暗 点 。 

图 8-29a 显示 了 CD 一 小 部 分 的 横 切 面 。 最 底层 是 由 透明 的 聚 碳酸 酯 塑料 制 成 的 ， 起 到 透 
明 盘 基 的 作用 。 塑 料 的 表面 可 以 通过 刻 出 止 坑 (pit ) 来 编程 存储 数据 ， 未 刻 的 部 分 称 为 平面 
( land )。 然 后 在 已 编程 的 盘 上 覆 上 一 个 很 薄 的 铝 反射 层 ， 再 在 铝 反射 层 外 覆 上 一 个 丙烯 酸 保护 
层 。 最 后 ， 再 履 上 最 外 层 并 印 上 标签 .光盘 的 总 厚度 是 1.2 毫米 ， 这 几乎 都 是 聚 碳酸 酯 塑料 的 
厚度 ， 其 他 层 都 非常 薄 。 

激光 源 和 光电 探测 需 被 放 在 聚 碳酸 酯 塑料 的 下 方 ， 发 出 的 光线 穿 过 塑料 层 ， 在 铝 反射 层 
上 被 反射 回来 ， 然 后 向 回 传播 到 光电 探测 器 。 注 意 从 激光 这 边 来 看 ， 凹 坑 实 际 上 是 一 个 高 于 平 
面 的 凸 起 。 

图 8-29b 显示 了 在 激光 束 沿 着 盘面 扫描 并 遇 到 一 个 从 四 坑 到 平面 的 转变 时 发 生 的 情况 ， 图 
中 显示 了 激光 源 和 探测 器 的 三 个 不 同位 置 ， 它 们 随 着 光盘 的 转动 而 出 现 。 当 光 只 是 在 止 坑 或 平 
面 上 反射 时 ， 探 测 器 会 看 到 反射 的 光 ， 它 将 探测 到 一 个 亮点 。 但 是 当 光 线 移 过 止 坑 和 相 邻 平面 
之 间 的 边 时 ， 就 会 发 生 不 同 的 情况 。 四 坑 接 近 激 光源 波长 的 114， 因 此 从 止 坑 和 相 邻 的 平面 反 
射 的 光线 相位 差 180 度 ， 它 们 互相 抵消 。 于 是 探测 器 在 门 坑 -平面 和 平面 - 凹 坑 的 转换 处 看 不 
到 反射 的 光线 ， 它 将 探测 到 一 个 暗 点 。 

图 8-29c 描述 了 在 平面 和 四 坑 之 间 的 一 些 转换 。 如 果 每 一 个 被 探测 为 暗 点 的 转换 表示 二 进 
制 值 1， 平 的 部 分 表示 0， 那 么 探测 到 的 二 进 制 模式 就 如 图 所 示 。 这 个 模式 不 直接 表示 所 存储 
的 数据 ，CD 使 用 一 个 复杂 的 编码 方案 来 表示 数据 。 每 字 节 的 数据 表示 成 14 位 的 编码 ， 它 提供 
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了 相当 强 的 错误 检测 能 力 。 我 们 不 会 深入 研究 这 个 编码 的 细节 。 
铝 丙烯酸 标签 





探测 器 激光 源 激光 源 探测 器 


b) 从 四 坑 到 平面 的 转变 


es 


0 100 10 0 001000@ 10 0 100 1 0 


c) 存储 的 二 进 制 模 式 
图 8-29 光盘 


止 坑 在 盘面 的 一 条 长 轨道 上 排列 ， 这 条 轨道 从 盘 的 中 间 螺 旋 伸 展 到 外 边缘 。 但 是 ， 习 惯 
上 我 们 把 每 个 跨越 360 度 的 圆 形 路 径 看 作 一 个 单独 的 轨道 ， 这 与 磁盘 使 用 的 技术 类 似 。CD 的 
直径 是 120 毫米 ， 在 中 心 有 一 个 15 毫米 的 孔 。 轨 道 覆盖 了 从 半径 25 毫米 到 58 毫米 的 区 域 。 
轨道 间 的 间隔 是 1.6 微米 ， 四 坑 0.5 微米 宽 ，0.8 到 3 微米 长 。 一 张 盘 上 有 超过 15 000 个 的 轨 
道 。 如 果 整 个 轨道 螺旋 被 展开 ， 它 的 长 度 将 超过 5 千 米 。 

2. CD-ROM 

因为 CD 以 二 进 制 的 形式 存储 信息 ， 所 以 它们 也 适合 用 作 计 算 机 系统 的 存储 介质 。 主 要 的 
挑战 是 要 保证 所 存储 数据 的 完整 性 。 因 为 凹 坑 很 小 ， 所 以 很 难 完全 正确 地 实现 每 一 个 止 坑 。 在 
音频 和 视频 应 用 中 ， 数 据 中 的 一 些 错误 是 可 以 容忍 的 ， 因 为 它们 对 再 现 的 声音 和 图 像 产生 的 影 
响 不 会 被 察觉 到 。 然 而 ， 这 样 的 错误 在 计算 机 应 用 中 是 不 可 接受 的 。 由 于 物理 上 的 缺陷 是 不 可 
避免 的 ， 所 以 需要 使 用 附加 的 位 来 提供 错误 检测 和 纠正 能 力 。 用 来 存储 计算 机 数据 的 CD 被 称 
为 只 读 光盘 ( CD-ROM )， 因 为 像 半导体 只 读 存 储 器 芯片 一 样 ， 它 们 的 内 容 只 能 被 读 取 。 
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数据 在 CD-ROM 的 轨道 上 按 块 的 形式 组 织 ， 这 些 块 被 称 为 该 区 ( sector )。 启 区 有 几 种 不 


同 的 格式 。 一 种 格式 称 为 模式 1， 它 使 用 2352 字 节 的 扇 区 。 每 个 扇 区 有 一 个 16 字 节 的 头 ， 包 


含 用 于 检测 扇 区 起 点 的 同步 字段 和 用 于 标志 鹿 区 的 寻 址 信息 。 后 面 跟着 的 是 2048 字 贡 的 存 
储 数据 。 在 扇 区 的 未 尾 还 有 288 字 节 ， 用 于 实现 错误 纠正 方案 。 每 个 轨道 的 扇 区 数 各 不 相 
同 ， 较 长 的 外 侧 轨道 上 有 更 多 的 扇 区 。 使 用 模式 1 这 种 格式 ，CD-ROM 有 大 约 650M 字 节 的 
存储 容量 。 

错误 检测 和 纠正 在 多 个 层次 上 进行 。 正 如 前 面 提 到 的 ， 存 储 在 CD 上 的 每 个 字 节 信 息 使 用 
14 位 的 代码 来 编码 ， 它 有 一 定 的 纠 错 能 力 ， 能 纠正 单个 位 的 错误 。 在 短 脉冲 中 产生 的 错误 会 
影响 多 个 位 ， 这 可 以 使 用 扇 区 末尾 处 的 错误 检查 位 来 检测 和 纠正 。 

CD-ROM 驱动 器 以 很 多 种 不 同 的 旋转 速度 工作 。 基 本 速度 称 为 1X， 是 每 秒 75 个 扇 区 ， 
如 果 使 用 模式 1 格式 ， 这 将 提供 153 600 字 节 / 秒 (150K 字 节 / 秒 ) 的 数据 传输 率 。 更 高 速度 
的 CD-ROM 驱动 器 用 相对 基本 速度 的 形式 标注 。 因 此 ， 一 个 56X 的 CD-ROM 的 数据 传输 率 
是 1X 的 CD-ROM 的 56 倍 ， 或 者 大 约 6M 字 节 / 秒 。 这 个 传输 速率 要 比 硬盘 的 传输 速率 低 得 
多 ,硬盘 的 传输 速率 在 每 秒 几 十 兆 字 节 的 范围 内 。 男 一 个 显著 的 性 能 区 别 是 寻 道 时 间 ， 在 CD- 
ROM 中 寻 道 时 间 可 能 是 几 百 毫秒 。 所 以 ， 就 性 能 而 言 ，CD-ROM 显然 要 劣 于 磁盘 ， 它 们 的 吸 
引力 在 于 其 物理 尺寸 小 ， 成 本 低 ， 还 有 容易 作为 可 拆 装 和 可 移动 的 海量 存储 介质 。 因 此 ， 它 们 
广泛 应 用 于 软件 发 布 、 教 科 书 、 应 用 程序 和 视频 游戏 中 ， 等 等 。 

3， 可 刻录 CD 

以 上 描述 的 CD 是 只 读 的 设备 ， 信 息 在 制造 的 时 候 存储 。 首 先 ， 使 用 高 功率 激光 在 需要 
凹 坑 的 位 置 烧 出 洞 ， 以 此 来 生产 一 个 母 盘 。 然 后 根据 母 盘 生产 一 个 模具 ， 它 在 有 洞 的 地 方 会 有 
凸 起 。 通 过 把 熔化 的 聚 碳酸 酯 塑料 注 和 人 模具 来 进行 复制 ， 就 可 以 生产 出 与 母 盘 止 坑 模式 相同 的 
CD 了 。 这 个 过 程 显 然 只 适合 包含 相同 信息 的 CD 的 批量 生产 。 

20 世纪 90 年 代 未 有 一 种 新 类 型 的 CD 被 开发 出 来 ， 计 算 机 用 户 可 以 很 容易 地 把 数据 刻 到 
它 上 面 ， 它 被 称 为 可 刻录 光盘 ( CD-Recordable，CD-R )。 在 生产 过 程 中 ， 在 光盘 上 做 出 了 一 
条 覆盖 着 有 机 染料 的 闪 亮 的 螺旋 轨道 。 然 后 ， 在 CD-R 驱动 器 中 使 用 激光 在 有 机 染料 上 烧 出 目 
坑 来 。 被 烧 的 点 变 得 不 透明 了 ， 当 读 取 CD 的 时 候 ， 这 些 点 比 闪 光 的 区 域 反射 的 光 要 少 。 这 个 
过 程 是 不 可 逆转 的 ， 这 意味 着 写 人 的 数据 被 永久 地 存储 。 光 盘 未 使 用 的 部 分 可 以 在 以 后 用 来 存 
储 其 他 数据 。 

4. 可 擦 写 CD 

最 灵活 的 CD 是 那些 可 以 由 用 户 多 次 写 入 的 CD,， 它们 被 称 为 可 擦 写 光盘 (CD- 
ReWritable, CD-RW )。 

CD-RW 的 基本 结构 与 CD-R 类 似 。 但 是 在 刻录 层 没有 使 用 有 机 染料 ， 而 是 使 用 银 、 钢 、 
匀 和 磋 的 合金 。 这 种 合金 在 被 加 热 和 冷却 时 发 生 的 反应 非常 有 趣 ， 也 非常 有 用 。 如 果 它 被 加 热 
到 超过 熔点 ( 500 摄氏 度 ) 然后 被 冷却 ， 就 变 成 非 晶 体 状态 ， 此 时 它 吸收 光线 。 但 是 如 果 它 只 
被 加 热 到 200 摄氏 度 左 右 ， 然 后 保持 一 段 时 间 ， 就 会 发 生 称 为 退火 ( annealing ) 的 过 程 ， 这 将 
导致 合金 变 成 晶体 状态 ， 此 时 它 允 许 光 线 穿 过 。 如 果 用 晶体 状态 来 表示 平面 区 域 ， 那 么 可 以 通 
过 把 选 定点 加 热 到 超过 熔点 来 创建 止 坑 。 存 储 的 数据 可 以 使 用 退火 过 程 来 擦 除 ， 这 使 合金 回 到 
统一 的 晶体 状态 。 反 射 材料 放 在 刻录 层 的 上 面 ， 在 光盘 被 读 取 的 时 候 用 来 反光 。 

CD-RW 驱动 器 使 用 三 种 不 同 功 率 的 激光 。 最 高 功率 用 来 刻录 凹 坑 ; 中 等 功率 用 来 把 合金 
变 成 晶体 状态 ， 它 被 称 为 擦 除 功率 ; 最低 功率 用 来 读 取 所 存储 的 信息 。 

为 读 写 CD-RW 光盘 而 设计 的 CD 驱动 器 通常 可 以 与 其 他 光盘 介质 一 起 使 用 ， 它 能 读 取 


第 8 章 ”存储 器 系统 : 211 


CD-ROM， 能 读 写 CD-R。 它 按 标准 互 连 接口 的 要 求 设计 ， 例 如 SATA 和 USB。 

CD-RW 光盘 提供 了 低 成 本 的 存储 介质 ， 它 们 适合 于 信息 的 档案 存储 ， 这 些 信息 的 范围 
可 以 从 数据 库 到 图 形 图 像 。 也 可 以 用 于 信息 的 小 批量 发 布 ， 与 CD-R 一 样 ， 还 可 以 用 于 备份 。 
CD-RW 技术 已 经 使 得 CD-R 不 那么 重要 了 ， 因 为 它 以 稍 高 一 点 的 成 本 提供 了 非常 好 的 性 能 。 

5. DVD 技术 

CD 技术 的 成 功 和 对 更 大 存储 容量 的 不 断 寻 求 导 致 了 了 DVD ( Digital Versatile Disk， 数 字 多 
功能 光盘 ) 技术 的 发 展 。 第 一 个 DVD 标准 是 由 一 个 企业 联盟 在 1996 年 制定 的 ， 目 标 是 能 在 
DVD 盘 的 一 面 上 存储 一 整 部 电影 。 

DVD 光盘 的 物理 尺寸 与 CD 相同 ， 盘 体 1.2 毫米 厚 ， 直 径 120 毫米 。 通 过 改变 下 面 几 项 
设计 使 得 它 的 存储 容量 比 CD 高 得 多 : 

e。 使 用 波长 为 635nm 的 红色 激光 器 代替 CD 中 使 用 的 波长 为 780nm 的 红外 激光 器 。 较 短 

的 波长 可 以 把 光线 聚焦 到 一 个 更 小 的 点 上 。 

e 四 坑 更 小 ， 最 小 长 度 为 0.4 微米 。 

e 轨道 更 接近 ， 轨 道 间 的 距离 是 0.74 微米 。 
使 用 了 这 些 改进 使 得 DVD 的 容量 可 达到 4.7G 字 节 。 

使 用 两 层 或 两 面 的 盘 可 以 进一步 增加 容量 。 单 层 单 面 的 盘 在 标准 中 定义 为 DVD-5， 它 的 
结构 与 图 8-29a 中 的 CD 几乎 一 样 。 双 层 盘 使 用 两 个 层 ， 每 层 都 刻 有 轨道 。 第 一 层 是 一 个 透明 
的 盘 基 ， 与 CD 盘 一 样 。 但 是 它 没 有 使 用 铝 来 反射 ， 而 是 在 这 层 的 平面 和 止 坑 上 覆盖 一 层 半 透 
明 的 材料 ， 把 它 作为 一 个 半 反 射 体 。 然 后 在 这 层 材料 的 表面 上 也 刻 上 四 坑 来 编程 以 存储 数据 。 
在 第 二 层 上 的 凹 坑 和 平面 上 再 放 上 一 层 反 射 材 料 。 这 种 盘 通 过 把 激光 束 聚 焦 到 需要 的 层 上 来 实 
现 读 取 。 当 激光 束 聚 焦 到 第 一 个 层 上 时 ， 半 透明 材料 反射 回 足 够 的 光 来 检测 所 存储 的 二 进 制 模 
式 ; 当 激 光束 聚焦 到 第 二 个 层 上 时 ， 反 射 材料 返回 的 光 显 示 了 这 一 层 所 存储 的 信息 。 在 这 两 种 
情况 下 ， 没 有 被 激光 束 聚 焦 的 层 反 射 回 少量 的 光 ， 它 被 探测 器 电路 当 作 噪声 消除 了 。 两 个 层 的 
总 存储 容量 是 8.5G 字 节 ， 在 标准 中 这 种 盘 被 称 为 DVD-9。 

两 个 单 面 盘 可 以 放 在 一 起 形成 一 个 类 似 三 明治 的 结构 ， 其 中 上 面 的 那 张 盘 要 翻 个 面 。 这 
可 以 使 用 单 层 盘 来 实现 ， 像 在 DVD-10 中 规定 的 ， 组 合成 的 盘 的 容量 是 9.4G 字 节 。 它 也 可 以 
使 用 双 层 盘 来 实现 ， 像 在 DVD-18 中 规定 的 ， 可 产生 17G 字 节 的 容量 。 

DVD 驱动 器 的 访问 时 间 与 CD 驱动 器 相似 ， 但 是 ， 当 DVD 盘 以 相同 的 速度 旋转 时 ， 由 于 
它 的 四 坑 密度 更 高 ， 所 以 它 的 数据 传输 率 要 高 得 多 。 人 们 还 开发 出 了 可 擦 写 的 DVD 设备 ， 可 
以 提供 很 大 的 存储 容量 。 


8.10.3 ”磁带 系统 


磁带 适合 用 于 大 量 数据 的 离线 存储 ， 它 们 通常 用 于 备份 和 归档 存储 。 磁 带 记录 时 使 用 了 
与 磁盘 相同 的 原理 ， 主 要 的 区 别 是 磁带 的 磁性 薄膜 是 镀 在 一 条 很 细 的 宽度 为 0.5 到 0.25 英寸 的 
塑料 带 上 。 在 磁带 的 宽度 方向 上 平行 记录 了 7 或 9 位 (对 应 一 个 字符 )， 它 与 磁带 的 运动 方向 
垂直 。 磁 带 上 每 个 位 的 位 置 都 有 一 个 单独 的 读 写 磁 头 ， 所 以 一 个 字符 的 所 有 位 能 并 行 读 出 或 写 
入 。 字 符 中 有 一 个 位 用 作 奇 偶 位 。 

磁带 上 的 数据 按 记 录 (record ) 的 形式 组 织 ， 记 录 由 间隙 分 开 ， 如 图 8-30 所 示 。 磁 带 的 
运动 只 有 在 记录 间 辽 位 于 读 写 磁头 下 方 时 才 会 停止 。 记 录 的 间 隐 足够 长 ， 人 允许 磁带 在 到 达 下 
一 个 记录 的 起 点 之 前 能 达到 正常 速度 。 如 果 使 用 类 似 于 图 8-27c 中 的 编码 方案 在 磁带 上 记录 数 
据 ， 那 么 记录 间 院 可 以 表示 为 没有 磁性 变化 的 区 域 。 这 人 允许 记录 间隙 的 检测 独立 于 所 记录 的 数 
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据 。 为 了 帮助 用 户 组 织 大 量 的 数据 ， 把 一 组 相关 的 记录 称 为 文件 ( file )。 文 件 的 起 点 通过 文件 
标记 (file mark ) 来 识别 ， 如 图 8-30 所 示 。 文 件 标 记 是 一 个 特殊 的 单字 符 或 多 字符 记录 ， 在 它 
前 面 通常 有 一 个 比 记 录 间 间隙 长 一 些 的 间隙 。 文 件 标记 后 的 第 一 个 记录 可 以 用 作文 件 的 文件 头 
( header ) 或 文件 标识 符 ( identifier )， 0 


上 件 标记 | 





全 一 文件 标记 


i 


eee ee 记录 a 记录 pe 
图 8-30 ”磁带 上 的 数据 组 织 结构 














盒 式 磁带 系统 

磁带 系统 已 经 被 开发 用 来 为 在 线 磁盘 存储 做 备份 。 其 中 有 一 种 这 样 的 系统 ， 它 使 用 8 毫 
米 的 视频 格式 磁带 ， 磁 带 位 于 一 个 盒子 中 。 这 种 部 件 被 称 为 盒 式 磁带 ， 它 们 的 存储 容量 为 2G 
到 5G 字 节 ， 能 以 每 秒 几 百 K 字 节 的 速度 传输 数据 。 可 通过 一 个 螺旋 扫描 系统 横 跨 磁带 进行 操 
作 来 实现 读 写 ， 这 与 盒 式 录像 带 驱 动 器 类 似 。 位 密度 能 达到 每 平方 英寸 几 千 万 比特 。 现 在 已 经 
有 能 自动 装 盒 和 印 念 的 多 盒 系统 ， 所 以 数 十 G 字 节 的 在 线 存储 备份 可 以 不 需要 人 来 干涉 。 


8.11 结束 语 


存储 器 层次 结构 的 设计 对 计算 机 系统 的 性 能 来 说 是 非常 重要 的 。 现 代 操 作 系统 和 应 用 程 
ee 在 本 章 中 ， 我 们 介绍 了 存储 器 系统 中 最 重要 的 技术 

组 织 结构 细节 ， 以 及 它们 如 何 演变 以 满足 这 些 要 求 。 

半导体 技术 的 发 展 使 得 存储 器 芯片 的 速度 和 容量 有 了 显著 的 提高 ， 每 位 的 成 本 也 大 幅 下 
降 。 计算机 存储 器 的 性 能 可 通过 使 用 存储 器 层次 结构 来 进一步 提高 。 今 天 ， 大 容量 上 且 价格 合理 
的 主 存 都 是 使 用 动态 存储 器 芯片 实现 的 。 系 统 中 还 总 是 会 提供 一 级 或 多 级 的 高 速 缓 存 ， 高 速 组 
存 的 引入 大 大 减少 了 处 理 器 所 看 到 的 有 效 存 储 器 访问 时 间 。 而 虚拟 存储 器 则 使 得 主 存 看 起 来 比 
物理 内 存 要 大 - 

磁盘 依然 是 辅助 存储 的 主要 技术 。 它 们 提供 了 极 大 的 存储 容量 ， 在 单个 驱动 器 上 可 达到 
或 超过 万 亿 字 节 ， 并 且 每 位 的 成 本 也 很 低 。 但 是 ， 闪 存 半导体 技术 也 已 开始 在 某 些 应 用 中 具有 
一 定 的 竞争 能 力 。 


8.12 ”问题 解析 

本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解决 这 样 的 问题 。 

问题 : 对 于 一 个 使 用 512K x 8 存储 器 芯片 的 8M x 32 存储 器 ， 描 述 一 种 类 似 于 图 8-10 的 结构 。 

解答 : 所 需 的 结构 本 质 上 与 图 8-10 中 的 一 样 ， 只 是 需要 16 行 、 每 行 有 4 个 512K x8 的 芯片 。 地 址 
线 Anso 需要 连接 到 所 有 的 芯片 上 上， 地 址 线 As 连接 到 一 个 4 位 的 译 码 器 上 ， 以 选择 16 行 中 的 一 行 。 

问题 : 一 个 计算 机 系统 使 用 32 位 的 存储 器 地 址 ， 它 的 主 存 有 1G 字 节 。 它 有 一 个 4K 字 节 的 高 速 组 
存 ， 按 组 相 联 的 形式 组 织 ， 每 组 4 个 块 ， 每 块 64 个 字 节 - 

(a ) 计算 主 存 地 址 中 的 Tag 、Set 和 Word 字段 的 位 数 。 
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(b ) 假设 高 速 缓存 初始 为 空 ， 处 理 器 从 位 置 0 开始 的 连续 字 单 元 中 取 1088 个 字 ， 每 个 字 4 个 字 节 ， 
然后 它 再 重复 这 个 取 操作 序列 9 次。 如果 高 速 缓存 比 主 存 快 10 倍 ， 估 算 一 下 使 用 高 速 缓存 后 性 能 提高 的 
倍数 。 假 设 在 块 替换 时 使 用 LRU 算法 。 

解答 : 连续 的 地 址 是 针对 字 节 来 说 的 ， 也 就 是 每 个 字 节 对 应 一 个 地 址 ， 即 按 字 节 编 址 。 

(a ) 一 个 块 有 64 个 字 节 ， 因 此 Word 字段 为 6 位 。 每 组 有 4 x 64 = 256 字 节 ， 所 以 有 4K / 256 = 16 
组 ，Set 字段 需要 4 位 。 剩 下 32-4-6=22 位 作为 Tag 字段 。 

(b ) 1088 个 字 构 成 68 个 块 ， 占 用 主 存 的 块 0 到 块 67。 高 速 缓存 有 64 块 的 空间 ， 因 此 ， 在 第 一 遍 
中 将 块 0，1，2，…，63 从 主 存 读 到 高 速 缓存 后 ， 高 速 缓存 就 满 了 。 接 下 来 的 编号 为 64 到 67 的 那 4 块 
映射 到 第 0，1，2 和 3 组 中 ， 每 一 块 将 替换 所 在 组 中 最 近 最 少 使 用 的 高 速 缓存 块 ， 就 是 块 0。 在 第 二 遍 
中 ， 主 存 块 0 将 被 重新 装 人 高 速 缓存 的 第 0 组 中 ， 因 为 它 已 经 被 块 64 覆盖 了 。 它 将 被 放 到 第 0 组 在 那个 
时 候 最 近 最 少 使 用 的 块 中 ， 就 是 块 1。 接 下 来 ， 主 存 块 1，2 和 3 将 分 别 替换 高 速 缓存 中 第 1, 2 和 3 组 
中 的 块 1。 主 存 块 4 到 15 将 在 高 速 缓存 中 找到 。 在 第 0 到 第 3 组 中 块 1 位 置 上 的 主 存 块 16 到 19 现在 被 
覆盖 ， 并 将 被 重新 装 和 这些 组 中 块 2 的 位 置 上 。 

随 着 执行 的 进行 , 16 个 高 速 缓存 组 中 前 四 个 组 的 所 有 主 存 块 在 下 一 遍 使 用 它们 之 前 通常 都 会 被 覆盖 。 
主 存 块 0，16，32，48 和 64 不 断 地 彼此 替换 ， 因 为 它们 竞争 高 速 缓存 中 第 0 组 的 4 个 块 位 置 。 在 第 1 
组 ( 主 存 块 1.17. 33，49，65), 第 2 组 ( 主 存 块 2，18, 34，50，66 ) 和 第 3 组 ( 主 存 块 3，19，35， 
51，67 ) 中 也 会 发 生 同 样 的 事情 。 最 后 12 个 组 (第 4 组 到 第 15 组 ) 中 的 主 存 块 在 第 一 遍 中 被 取出 一 次 ， 
然后 在 接 下 来 的 9 饥 中 一 直 保 持 在 高 速 缓存 中 。 

总 之 ,在 第 一 遍 中 ， 所 有 68 个 块 都 被 从 主 存 中 取出 。 在 后 9 遍 的 每 一 遍 中 ，48 个 块 能 在 高 速 缓存 
的 第 4 组 到 第 15 组 中 找到 ， 剩 下 的 20 个 块 必 须 从 主 存 中 提取 。 假 设 z* 为 高 速 缓存 的 访问 时 间 ， 则 








无 高 速 缓存 时 的 时 间 
-能 担 训 的 位 数 = 
性 能 提高 的 倍数 ~ 有 高 速 缓存 时 的 时 间 
10x68x10r 
1x68x1lrr9(20x 11r+487) 
= 2.15 


这 个 例子 说 明了 在 执行 程序 循环 期 间 LRU 算法 的 缺点 。 这 种 情况 下 另 一 种 算法 的 性 能 参见 
习题 8.9。 
问题 : 假设 一 台 计 算 机 的 处 理 器 有 两 个 一 级 高 速 缓存 ( 一 个 用 于 指令 ， 另 一 个 用 于 数据 ) 和 一 个 二 
级 高 速 缓存 ，。 假 设 z 为 两 个 一 级 高 速 缓存 的 访问 时 间 ， 将 一 个 块 从 二 级 高 速 缓存 传输 到 一 级 高 速 缓存 的 
失效 开销 大 约 为 15r， 从 主 存 传输 到 二 级 高 速 缓存 大 约 为 100r。 针 对 该 问题 ， 我 们 假设 指令 和 数据 的 命 
中 率 相 同 ， 并 且 一 级 高 速 缓存 和 二 级 高 速 缓存 的 命中 率 分 别 为 0.96 和 0.80。 
(a) 在 一 级 和 二 级 高 速 缓存 中 访问 都 失效 ， 因 而 需要 访问 主 存 的 比例 是 多 少 ? 
(b ) 处 理 器 所 看 到 的 平均 访问 时 间 是 多 少 ? 
(c ) 假设 二 级 高 速 缓存 的 理想 命中 率 为 1， 处 理 器 所 看 到 的 平均 存储 器 访问 时 间 将 被 减少 多 少 倍 ? 
(d) 考虑 下 面 对 存 储 器 层次 结构 的 改变 : 二 级 高 速 缓存 被 移 走 ， 两 个 一 级 高 速 缓存 的 容量 被 增加 ， 
因而 它们 的 失效 率 减少 了 一 半 。 在 这 种 情况 下 ， 处 理 器 所 看 到 的 平均 存储 器 访问 时 间 是 多 少 ? 
解答 : 只 具有 一 个 高 速 缓存 级 别 的 平均 存储 器 访问 时 间 在 8.7.1 节 中 给 出 ， 如 下 : 
tgs=hC4(1=h) 
有 具有 一 级 和 二 级 高 速 缓存 的 平均 存储 器 访问 时 间 在 8.7.2 节 中 给 出 ， 如 下 : 
tog =hCit+(1—h)(hC+(1—-h)M) 
(a) 在 一 级 和 二 级 高 速 缓存 中 访问 都 失效 时 的 存储 器 访问 比例 为 
(1—h)(1—h)=(1—-0.96)(1—-0.80)=0.008 
(b ) 使 用 两 个 高 速 缓存 级 别 的 平均 存储 器 访问 时 间 为 
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Lae = 0.96r+0.04( 0.80 x 15r+0.20 x 100r ) 
= 2.24Tr 
(c ) 如 果 在 二 级 高 速 缓存 中 没有 失效 ， 我 们 得 到 : 
log( 理想 ) = 0.96r+ 0.04 x 15r= 1.56r 
因此 ， 
lus( 实 际 ) 2.24r _ 
As( 理想) 156r 


(d) 如 果 使 用 更 大 的 一 级 高 速 缓存 ， 并 将 二 级 高 速 缓存 移 除 ， 则 访问 时 间 为 


tne = 0.98r+0.02 x 100r= 2.98r 

问题 : 一 个 由 32 位 的 数组 成 的 1024 x 1024 数组 按 以 下 方法 标准 化 。 对 每 一 列 ， 找 到 最 大 的 元 素 ， 
然后 将 这 个 列 中 的 所 有 元 素 都 除 以 这 个 元 素 的 值 。 假 设 虚拟 存储 器 中 每 页 包含 4K 字 节 ， 并 且 在 这 个 计 
算 中 主 存 的 1M 字 节 被 分 配 用 来 存储 数组 数据 。 假 定 当 发 生 页 故障 时 从 磁盘 装载 一 个 页 到 主 存 需 要 10 

(a) 假设 一 次 处 理 该 数组 的 一 列 ， 如 果 数 组 元 素 按 列 顺序 存储 在 虚拟 存储 器 中 ， 会 发 生 多 少 次 页 故 
障 ? 需要 多 长 时 间 才 能 完成 这 个 标准 化 过 程 ? 

(b ) 假设 元 素 按 行 顺序 存储 ， 重 复 (a ) 的 问题 。 

(c ) 当 数 组 按 行 顺序 存储 在 存储 器 中 时 ， 提 出 另 一 种 处 理 这 个 数组 的 方法 ， 以 减少 页 故障 的 次 数 。 
估算 页 故障 的 次 数 以 及 你 的 解决 方案 所 需要 的 时 间 。 

解答 : 每 一 个 32 位 的 数 构成 4 字 节 ， 因 此 ， 每 页 容纳 1024 个 数 。 在 计算 中 被 分 配 用 来 存储 数据 的 
那 1M 字 节 的 主 存 部 分 有 256 页 的 空间 。 

(a ) 每 一 列 存储 在 一 页 中 ， 将 每 一 列 放 到 主 存 中 有 一 次 页 故障 ， 共 1024 次 页 故障 。 

处 理 时 间 = 1024 x 10 毫秒 =10.24 秒 

(b ) 每 一 列 的 处 理 需 要 两 遍 ， 第 一 遍 为 了 找到 最 大 的 元 素 ， 第 二 遍 为 了 执行 标准 化 。 当 处 理 第 一 列 
时 ， 每 个 元 素 的 访问 导致 一 次 页 故障 ， 会 将 相应 行 的 所 有 元 素 都 装 人 主 存 中 。256 个 元 素 被 检查 后 ， 主 
存 已 满 。 接 下 来 256 个 元 素 的 访问 导致 页 故障 ， 替 换 主 存 中 所 有 的 数据 ， 然 后 重复 这 个 过 程 。 因 此 ， 数 
组 中 每 一 个 元 素 的 每 一 次 访问 都 会 发 生 一 次 页 故障 。 

处 理 时 间 =2 x 1024 x 1024 x 10 毫秒 = 20 972 秒 = 5.8 小 时 

(c) 对 于 数据 的 这 种 布局 ， 另 一 种 更 有 效 的 方法 是 在 第 一 遍 中 先 完 成 每 一 列 的 114 ， 然 后 再 处 理 第 
二 个 114， 等 等 。 第 二 遍 采 用 相同 的 方法 处 理 。 在 这 种 情况 下 ， 通 过 数组 的 每 一 遍 导 致 1024 次 页 故障 ， 
共 2048 次 。 





处 理 时 间 = 2048 x 10 毫秒 = 20.48 秒 

这 个 例子 说 明了 当主 存 容量 不 足以 存放 应 用 程序 的 情况 下 ， 页 故障 的 次 数 是 如 何 显 著 增加 的 。 这 种 
行为 被 称 为 系统 颠 笋 ( thrashing )。 

问题 : 考虑 一 个 磁盘 访问 的 长 序列 ， 磁 盘 的 平均 寻 道 时 间 为 6 毫秒 ， 平 均 旋转 延迟 为 3 毫秒， 所 访 
问 块 的 平均 大 小 为 8K 字 节 ， 从 磁盘 传输 数据 的 速率 为 34M 字 节 / 秒 。 

(a ) 假设 这 些 数据 块 随机 分 布 在 磁盘 上 ， 估 算 一 下 寻 道 操作 和 旋转 延迟 所 占 总 时 间 的 平均 百分比 。 

(b ) 重新 排列 这 些 磁 盘 访 问 ， 使 得 在 90% 的 情况 中 下 一 次 访问 的 数据 块 与 这 次 访问 的 数据 块 在 同一 
个 柱 面 上 。 在 这 种 情况 下 重复 第 一 问 。 

解答 : 传输 一 个 数据 块 需要 花费 8K /34M = 0.23 毫秒 。 

(a ) 访问 每 个 数据 块 所 需 的 总 时 间 为 6 + 3 + 0.23 = 9.23 毫秒 。 寻 道 和 旋转 延迟 所 占 时 间 的 比例 为 
919.23 = 0.97 = 97%。 

(b ) 90% 的 情况 下 只 需要 旋转 延迟 - 因此 ， 访 问 一 个 数据 块 的 平均 时 间 是 0.9 x 3+0.1 x 9+0.23 = 
3.89 毫秒 。 寻 道 和 旋转 延迟 所 占 时 间 的 比例 为 3.6/ 3.89 = 0.92 = 92%。 
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习题 

[M] 8.1 考虑 图 8-6 中 的 动态 存储 器 单元 。 假 设 C = 30 飞 法 ( 10“ 法 )， 通 过 晶体 管 的 泄漏 电流 大 约 是 
0.25 皮 安 (10-2 安 )， 当 电容 充满 电荷 时 ， 它 两 端的 电压 为 1.5 伏 。 这 个 单元 必须 在 电压 降 到 0.9 
伏 之 前 进行 刷新 。 估 算 最 小 刷新 率 。 

[M] 8.2 考虑 由 SDRAM 芯片 构造 的 主 存 ， 数 据 以 脉冲 串 的 形式 传输 ， 如 图 8-9 所 示 ， 只 是 脉冲 长 度 为 8。 
假设 并 行 传输 32 位 数据 ， 如 果 使 用 400MHz 的 时 钟 ， 传 输 下 面 数据 需要 多 少时 间 : 
(a ) 32 字 节 数据 
(b ) 64 字 节 数据 
每 种 情况 的 延迟 是 多 少 ? 

[E] 8.3 对 于 一 个 使 用 1M x 4 存储 器 芯片 的 16M x 32 存储 器 ， 描 述 它 的 类 似 图 8-10 的 结构 。 

[E] 8.4 分 析 下 面 这 句 话 为 什么 不 对 :“ 使 用 更 快 的 处 理 器 芯片 可 以 相应 地 提高 计算 机 的 性 能 ， 尽 管 主 存 
的 速度 保持 不 变 。” 


[M] 8.5 一 台 计 算 机 的 主 存 是 按 字 节 编 址 的 ， 字 长 为 32 位 。 
一 个 程序 包含 两 个 嵌 套 的 循环 一 一 较 小 的 内 部 循环 8 


和 较 大 的 外 部 循环 。 程 序 的 一 般 结 构 在 图 P8-1 中 1 

给 出 ， 图 中 十 进 制 的 主 存 地 址 显示 了 两 个 循环 的 位 | 

置 和 整个 程序 的 起 点 和 终点 ， 在 程序 不 同 部 分 (8-- M0 | 机 却 交 es 
52、56-136、140-240 等 ) 的 所 有 存储 单元 都 包含 | | | 下 要 和 中 执行 
按 线性 顺序 执行 的 指令 。 这 个 程序 在 按 直接 映射 方 ee 
法 (参见 图 8-16 ) 组 织 指令 高 速 缓存 的 计算 机 上 运 

行 ， 并 且 各 个 参数 如 下 a 

高 速 缓存 大 小 1K 字 节 

块 大 小 128 字 节 END 1504 

指令 高 速 缓存 的 失效 开销 是 80r， 其 中 1 是 高 速 绥 

存 的 访问 时 间 。 计 算 在 图 P8-1 中 的 程序 执行 期 间 P8-1 习题 8.5 的 程序 结构 

取 指 令 需 要 的 总 时 间 。 - 


[M] 8.6 一 台 字 长 为 16 位 的 计算 机 有 一 个 直接 映射 的 高 速 缓存 ， 用 于 指令 和 数据 。 主 存 地 址 是 16 位 长 ， 
且 主 存 是 按 字 节 编 址 的 。 高 速 缓存 的 容量 很 小 ， 它 只 包含 4 个 16 位 的 字 ， 每 个 字 构成 一 个 高 速 
缓存 块 ， 并 有 一 个 相 联 的 13 位 的 标志 ， 如 图 P8-2a 所 示 。 使 用 地 址 的 低 3 位 来 访问 高 速 缓存 中 
的 字 。 当 读 指令 或 数据 操作 数 期 间 发 生 一 次 失效 时 ， 把 请 求 的 字 从 主 存 读 出 ， 然 后 送 到 处 理 器 
中 。 同 时 它 被 拷贝 到 高 速 缓存 中 ， 并 且 其 块 号 被 存 到 相 联 的 标志 中 。 考 虑 下 面 的 短 循环 ， 其 中 所 


有 的 指令 都 是 16 位 长 。 
LOOP: Add RO0, (R1)+ 
Decrement R2 
BNE LOOP 


假设 在 进入 循环 前 ， 寄 存 器 RO、R1 和 R2 包含 的 内 容 分 别 为 0、054E 和 3。 再 假设 主 存 中 包含 
图 P8-2b 所 示 的 数据 ， 其 中 所 有 的 人 口 都 以 16 进 制 给 出 。 循 环 在 LOOP=02EC 处 开始 。 在 Add 
指令 中 使 用 自动 增 量 寻 址 方式 去 访问 一 个 列表 (包含 3 个 数 ) 中 的 连续 的 数 ， 并 把 它们 加 到 寄存 
器 RO 中 。 计 数 寄存 器 R2 递减 直到 它 到 达 0， 这 时 从 循环 中 退出 。 
(a ) 开始 时 高 速 缓存 是 空 的 ， 写 出 每 执行 完 一 次 循环 后 高 速 缓存 中 的 内 容 ， 包 括 标志 位 。 
(b ) 假设 高 速 缓存 和 主 存 的 访问 时 间 分 别 是 和 10r， 计 算 每 次 循环 的 执行 时 间 ， 只 计算 存储 器 
访问 时 间 。 

[M] 8.7 重复 习题 8.6， 假 设 在 高 速 缓存 中 只 存储 指令 ， 数 据 操作 数 直接 从 主 存 中 获取 ， 并 且 不 拷贝 到 高 
速 缓存 中 。 为 什么 这 种 选择 比 把 指令 和 数据 都 装 入 高 速 缓存 中 执行 速度 更 快 ? 

[E] 8.8 一 个 组 相 联 高 速 缓存 共 包 含 64 个 块 ， 每 组 4 块 。 主 存 有 4096 个 块 ， 每 块 有 32 个 字 。 假 设 有 一 
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个 32 位 字 节 编 址 的 地 址 空间 ， 在 每 个 Tag 、Set 和 Word 字段 中 各 有 多 少 位 ? 
13 位 16 位 





a ) 高 速 缓存 b ) 主 存 
图 P8-2 习题 8.6 中 高 速 缓存 和 主 存 中 的 内 容 


[M] 8.9 考虑 例 8.3 中 的 高 速 缓存 ， 假 设 每 当 从 主 存 中 读 出 一 个 新 块 ， 并且 它 在 高 速 缓存 中 对 应 的 组 已 经 
满 了 ， 新 块 就 替换 这 个 组 中 最 近 使 用 的 块 。 推 算出 第 二 问 在 这 种 情况 下 的 解决 方案 。 

[D] 8.10 8.6.3 节 用 图 8-20 中 的 程序 描述 了 不 同 高 速 缓存 映射 技术 的 效果 。 假设 这 个 程序 的 第 二 个 循环 
中 元 素 处 理 的 顺序 改 成 与 第 一 个 循环 相同 ， 也 就 是 使 用 如 下 语句 控制 第 二 个 循环 

fori:=0to9do 
推算 出 图 8-21 到 图 8-23 针对 这 个 程序 的 等 价 形式 。 从 这 个 习题 可 以 得 出 什么 结论 7 
[M] 8.11 一 台 按 字 节 编 址 的 计算 机 有 一 个 能 容纳 8 个 32 位 字 的 小 数据 高 速 缓存 ， 每 个 高 速 缓存 块 有 1 个 
32 位 的 字 。 当 执行 一 个 给 定 的 程序 时 ， 处 理 器 按 下 列 十 六 进 制 地 址 顺序 读 取 数据 : 
200, 204, 208, 20C, 2F4, 2F0, 200, 204, 218, 21C, 24C, 2F4 
这 个 模式 重复 四 遍 . 
(a ) 假设 高 速 缓存 初始 为 空 。 如 果 使 用 直接 映射 方式 ， 写 出 每 次 循环 结束 时 高 速 缓存 中 的 内 容 ， 
并 计算 命中 率 。 
(b ) 如 果 换 成 采用 LRU 替换 算法 的 相 联 映射 高 速 缓存 ， 重 复 第 一 问 。 
(c ) 如 果 是 4 路 组 相 联 高 速 缓存 ， 重 复 第 一 问 。 

[M] 8.12 假设 每 个 高 速 缓存 块 包含 两 个 32 位 的 字 ， 重 复习 题 8.11。 在 第 三 问 中 ， 使 用 2 路 组 相 联 高 速 组 
存 ， 它 采用 LRU 替换 算法 。 

[E] 8.13 在 很 多 计算 机 中 ， 高 速 缓存 块 的 大 小 在 32 字 节 到 128 字 节 之 间 的 范围 内 。 使 用 更 大 或 更 小 的 高 
速 缓存 块 的 主要 优点 和 缺点 各 是 什么 ? 

[M] 8.14 一 台 计 算 机 有 L1 和 L2 两 级 高 速 缓存 。 对 于 hs=0.75 和 hs=0.85 这 两 个 值 ， 绘 制 两 张 平均 存储 器 
访问 时 间 (> 轴 ) 相对 于 命中 率 h (x 轴 ) 的 图 , 几 使 用 值 0.90，0.92，0.94 和 0.96。 假 设 LI 
和 L2 高 速 缓存 的 失效 开销 分 别 是 15r 和 100r， 其 中 z* 是 L1 高 速 缓存 的 访问 时 间 。 

[E] 8.15 考虑 例 8.4 中 描述 的 两 级 高 速 缓存 ， 该 例子 第 二 问 的 解决 方案 中 给 出 了 平均 访问 时 间 是 2.24r。 
如 果 所 有 其 他 的 参数 都 跟 该 例子 中 的 相同 ， 要 将 i 减少 为 1.5r， 需 要 hh 的 值 为 多 少 ? 通过 提 
高 二 级 (L2 ) 高 速 缓存 的 命中 率 能 和 否 达 到 相同 的 结果 ? 

[E] 8.16 考虑 下 面 对 高 速 缓存 概念 的 类 比 。 一 个 修理 员 到 一 个 住宅 修理 加 热 系 统 。 他 带 了 一 个 工具 箱 ， 
里 面 有 他 最 近 在 类 似 工 作 中 使 用 的 工具 。 他 反复 使 用 这 些 工 具 ， 直 到 需要 其 他 的 工具 。 可 能 在 
屋外 的 卡车 上 有 他 需要 的 工具 , 但是， 如 果 卡 车 上 没有 ， 他 就 必须 回 店铺 中 去 拿 。 
假设 我 们 把 工具 箱 、 卡 车 和 店铺 对 应 成 一 级 (LI1 ) 高 速 缓存 、 二 级 (L2 ) 高 速 缓存 和 计算 机 主 
存 ， 那 么 这 个 类 比 是 否 恰当 ?讨论 它 正 确 和 不 正确 的 地 方 。 

[E] 8.17 使 用 一 个 二 级 ( L2 ) 高 速 缓存 的 目的 是 为 了 减少 一 级 (L1 ) 高 速 缓存 的 失效 开销 ， 进 而 减少 处 
理 器 所 看 到 的 存储 器 访问 时 间 。 另 一 种 方法 是 增加 一 级 (LI1 ) 高 速 缓存 的 容量 来 提高 它 的 命中 
率 ， 限 制 该 方法 效用 的 因素 是 什么 ? 

[M] 8.18 分 析 8.7.1 节 的 例 8.1 中 给 出 的 假设 “失效 开销 对 读 访 问 和 写 访问 都 是 相同 的 ”为 什么 不 对 。 在 
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兰 述 你 的 答案 时 考虑 8.6 节 所 描述 的 直接 写 和 写 回 这 两 种 情况 。 

[M] 8.19 考虑 一 个 计算 机 系统 ， 其 物理 内 存 的 可 用 页 在 几 个 应 用 程序 中 分 配 。 操 作 系统 监视 页 的 传送 活 
动 并 动态 地 调整 分 配给 不 同 程序 的 页 数量 。 给 出 一 个 能 被 操作 系统 用 来 最 小 化 总 体 页 传送 率 的 
合适 策略 。 

[M] 8.20 在 一 台 有 虚拟 存储 器 系统 的 计算 机 中 ,一 条 指令 的 执行 可 能 被 页 故障 中 断 。 为 了 能 使 这 条 指令 
在 以 后 能 继续 执行 ， 需 要 保存 哪些 状态 信息 ?” 注意 把 一 个 新 页 装 人 主 存 涉 及 DMA 传输 ， 它 需 
要 执行 其 他 的 指令 。 放 弃 被 中 断 的 指令 ， 以 后 再 把 它 完 全 重新 执行 一 遍 是 否 更 简单 ”重新 执行 
一 过 能 实现 吗 ? 

[E] 8.21 当 一 个 程序 产生 一 个 对 不 在 物理 主 存 中 的 页 引用 时 ， 这 个 程序 的 执行 会 被 挂 起 ， 直 到 所 请 求 的 
页 从 硬盘 装载 到 主 存 。 当 一 个 页 中 一 条 指令 的 操作 数 在 另 一 个 页 中 时 ， 会 有 什么 困难 发 生 ? 为 
了 处 理 这 种 情况 ， 处 理 器 必须 拥有 何 种 能 力 ? 

[M] 8.22 一 个 磁盘 部 件 有 24 个 记录 面 ， 它 共有 14 000 个 柱 面 ， 平 均 每 个 磁道 有 400 个 扇 区 ， 每 个 扇 区 
包含 512 字 节 的 数据 。 

(a ) 这 个 磁盘 部 件 最 多 能 存储 多 少 字 节 ? 
(b ) 以 7200rpm 的 速度 旋转 时 ， 数 据 传输 率 是 每 秒 多 少 字 节 ? 
(c ) 如 果 使 用 32 位 的 字 ， 给 出 一 个 指定 磁盘 地 址 的 合理 方案 。 

[M] 8.23 考虑 一 个 磁盘 访问 的 长 序列 ， 该 磁盘 的 平均 寻 道 时 间 是 8 毫秒 ， 平 均 旋 转 延 迟 是 3 毫秒 ， 数 据 
传输 率 是 60M 字 节 / 秒 。 所 访问 块 的 平均 大 小 是 64K 字 节 。 假 设 每 个 数据 块 存储 在 连续 的 扇 
区 中 。 

(a ) 假设 这 些 块 随机 分 布 在 磁盘 上 ， 估 算 寻 道 操作 和 旋转 延迟 所 占 总 时 间 的 平均 百分比 。 
(b ) 假设 从 邻近 的 柱 面 按 顺 序 传输 20 个 块 ， 寻 道 时 间 减 少 为 1 毫秒 。 如 果 这 些 块 随机 分 布 在 这 
些 柱 面 上 ， 那 么 总 的 传输 时 间 是 多 少 ? 

[M] 8.24 磁盘 系统 的 平均 寻 道 时 间 和 旋转 延迟 分 别 是 6ms 和 3ms， 向 或 从 磁盘 传输 数据 的 速率 是 30M 字 
节 / 秒 ， 并 且 所 有 的 磁盘 访问 都 是 对 存储 在 连续 扇 区 上 的 8K 字 节 数据 的 访问 。 数 据 块 存储 在 磁 
盘 上 的 任意 位 置 。 磁 盘 控 制 器 有 8K 字 节 的 缓冲 区 。 磁盘 控制 器 、 处 理 器 和 主 存 都 连 到 一 个 单 
一 的 总 线 上 ， 总 线 数据 宽度 为 32 位 ， 向 或 从 主 存 的 一 次 总 线 传输 花费 10 纳 秒 。 

(a ) 能 同时 向 或 从 主 存 传输 数据 的 磁盘 部 件 的 最 大 数目 是 多 少 ? 
(b ) 在 一 个 长 时 间 段 内 要 传输 一 系列 独立 的 8K 字 节 ， 在 这 段 时 间 内 平均 有 百 分 之 几 的 主 存 访 
问 被 磁盘 部 件 使 用 ? 

[M] 8.25 在 大 多 数 虚拟 存储 器 系统 中 使 用 磁盘 作为 辅助 存储 设备 ， 用 来 存储 程序 和 数据 文件 ， 哪 些 磁盘 

参数 将 对 页 大 小 的 选择 产生 影响 ? 
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本 章 目 标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 加 法 器 和 减法 器 电路 

e 基于 超前 进位 逻辑 电路 的 高 速 加 法 器 

e 有 符号 数 乘法 的 Booth 算法 

e 基于 进位 保留 加 法 的 高 速 乘法 器 

e 除法 运算 逻辑 电路 

e 符合 IEEE 标准 的 浮 点 数 算术 运算 

两 个 数 的 加 和 减 是 所 有 计算 机 中 机 器 指令 层次 的 基本 运算 ， 同 其 他 的 算术 和 逮 辑 运算 一 
样 ， 这 些 运算 是 在 处 理 器 的 算术 逻辑 部 件 (ALU ) 中 实现 的 。 本 章 将 介绍 实现 算术 运算 的 逻辑 
电路 。 执 行 加 法 或 减法 运算 所 需要 的 时 间 会 影响 处 理 器 的 性 能 。 与 加 减 运算 相 比 ， 乘 除 运算 需 
要 更 复杂 的 电路 ， 并 且 也 会 影响 处 理 器 的 性 能 。 我 们 将 介绍 几 种 现代 计算 机 中 使 用 的 高 速 执行 
算术 运算 的 技术 ， 也 将 对 浮 点 数 运算 进行 描述 。 

我 们 在 第 1 章 的 1.4 节 中 描述 了 有 符号 二 进 制 数 的 表示 ， 还 指出 了 对 于 执行 加 减 运算 来 
说 ， 补 码 是 最 好 的 表示 方法 。 在 图 1-6 的 例子 中 我 们 看 到 ， 两 个 n 位 有 符号 数 可 以 使 用 n 位 二 
进 制 加 法 相 加 ， 对 符号 位 用 与 其 他 位 一 样 的 方法 进行 处 理 。 换 句 话 说 ， 计 算 无 符号 二 进 制 数 加 
法 的 逻辑 电路 也 可 以 用 来 计算 补 码 表示 的 有 符号 数 的 加 法 。 本 章 的 前 两 节 将 介绍 加 法 与 减法 的 
逻辑 电路 。 


9.1 有 符号 数 加 减法 


图 9-1 显示 了 将 两 个 数 了 、 了 中 同等 权重 的 两 位 x; 和 y; 相 加 时 ， 求 和 函数 与 进位 输出 函数 
的 真 值 表 。 图 中 还 给 出 了 这 两 个 函数 的 逻辑 表达 式 ， 以 及 两 个 4 位 无 符号 数 7 和 6 相 加 的 例 
子 。 请 注意 加 法 过 程 中 的 每 一 步 都 必须 包含 一 个 进位 输入 位 。 我 们 用 c; 表示 第 i 步 的 进位 输 
入 ， 同 时 它 也 是 第 (i-1) 步 的 进位 输出 。 

图 9-1 中 s; 的 逻辑 表达 式 可 以 用 一 个 三 输入 端的 异 或 门 实现 ， 在 图 9-2a 中 它 是 单 步 二 进 
制 加 法 所 需 逻 辑 的 一 部 分 。 如 图 中 所 示 ， 进 位 输出 函数 c +1 使 用 与 -或 电路 实现 。 图 中 还 使 
用 了 一 个 方便 的 符号 一 全 加 器 ( full adder, FA ) 来 表示 单 步 加 法 所 需 的 全 部 逻辑 电路 。 

9-2b 显示 了 n 个 全 加 器 部 件 的 级 联 ， 可 以 用 来 计算 两 个 n 位 数 的 加 法 。 由 于 进位 要 在 
级 联 中 像 水 波 一 样 传播 下 去 ， 所 以 这 种 结构 被 称 为 行 波 进位 加 法 器 (ripple-carry adder )。 

最 低 有 效 位 ( least-significant-bit，LSB ) 位 置 上 的 进位 输入 co 提供 了 为 数字 加 1 的 简单 方 
法 。 例 如 ， 为 得 到 一 个 数 的 补 码 需要 对 该 数 的 反 码 加 1。 进 位 信和 号 还 可 以 用 来 将 磊 个 加 法 器 互 
连 起 来 ， 从 而 形成 可 以 处 理 kn 位 输入 数字 的 加 法 器 ， 如 图 9-2c 所 示 。 


加 法 /减法 逻辑 部 件 
图 9-2b 中 的 4 位 加 法 器 可 以 用 来 计算 补 码 数 了 和 了 的 加 法 ， 其 中 x 与 六-1 位 为 符号 位 。 
进位 输出 位 c, 并 不 是 加 法 结果 的 一 部 分 。1.4 节 讨 论 了 算术 溢出 。 当 两 个 操作 数 的 符号 相同 ， 
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但 计算 结果 的 符号 不 同时 会 发 生 溢出 。 因 此 ， 可 以 为 n 位 加 法 器 添加 执行 以 下 敢 辑 表达 式 的 洲 
出 检测 电路 : 


洲 ! 时 Jr-=1Jm-l1Sn-l 十 Xn=1 Dn-1Sn-1 

















沁 yi 进位 输入 ci 和 8% 进位 输出 cn; 
0 0 0 0 0 
0 0 1 1 0 
0 1 0 1 0 
0 1 1 0 1 
1 0 0 1 0 
1 0 0 1 
1 1 0 0 1 
1 1 1 1 1 








XiViCi 率 XViCi t TViCi 中 如 中 Ci 三重 Oy 四 ci 


tl™ WC tC tA 





XxX 人 O 1| 1 1 、 i 、 

有 了 = +6 = +o011l1ol0n 进位 输出 DD 交口 进 和 输入 
Z 1 Si 

第 i 位 的 图 例 

图 9-1 单 步 二 进 制 加 法 的 逻辑 说 明 


还 可 以 证 明 当 进 位 位 c 与 cm- 不 同时 就 发 生 了 溢出 〈 参 见习 题 9.5 )。 因此， 使 用 一 个 异 
或 门 执行 表达 式 cs 由 cn-1 就 可 以 得 到 更 简单 的 溢出 检测 电路 。 

为 了 执行 补 码 数 羡 与 了 的 减法 操作 X-Y， 我们 先 得 到 了 的 补 码 再 将 其 与 X 相 加 。 图 9-3 
所 示 的 逻辑 电路 可 以 根据 加 法 /减法 输入 控制 线 上 的 值 来 执行 加 法 或 减法 操作 。 执 行 加 法 时 将 
控制 线 置 0， 将 了 不 加 改变 地 送 至 加 法 器 的 一 个 输入 端 ， 并 使 进位 输入 信和 号 co 为 0。 当 将 加 / 
减 控制 线 置 1 时 ,将 7 通过 异 或 门 形 成 反 码 ( 即 按 位 取 反 )， 并 且 将 ce 置 1 从 而 得 到 了 的 补 
码 。 回 顾 一 下 ,负数 补 码 的 计算 方法 与 正 数 是 完全 相同 的 。 可 以 在 图 9-3 中 添加 一 个 异 或 门 来 


检测 洲 出 条 件 Cn 由 Cn-lo B37 

Yi 

6 
Xs 

x 

i 村 站 ci+1 

Ci 

bE 二 

wr yi 

yi 

ci+1 全 加 器 (FA)|=< 一 i 

寻 
a ) 单 步 的 逻辑 


图 9-2 二进制 数 的 加 法 逻辑 
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n 位 加 法 器 


Sl 31 30 


图 9-3 二进制 加 法 /减法 逻辑 电路 


9.2 快速 加 法 器 设计 


如 果 图 9-3 中 的 加 法 /减法 电路 使 用 位 行 波 进位 加 法 器 ， 可 能 需要 经 历 很 长 的 延迟 才能 
得 到 输出 so 至 w-; 以 及 cr。 这 个 延迟 是 否 可 以 接受 只 取决 于 其 他 处 理 器 部 件 的 速度 以 及 寄存 
器 和 高 速 缓存 的 数据 传输 时 间 的 要 求 。 一 个 多 辑 门 网 络 所 需 的 延迟 依赖 于 构造 该 网 络 的 集成 电 
路 的 电子 工艺 ， 以 及 从 输入 至 输出 所 经 历 的 逻辑 门 的 数目 。 通 过 任何 一 个 以 特定 工艺 制造 的 门 
构成 的 组 合 电路 所 需 的 延迟 ， 是 该 电路 中 最 长 信号 传输 路 径 上 所 有 逻辑 门 延迟 的 总 和 。 对 于 
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n 位 行 波 进位 加 法 器 ， 最 长 路 径 是 从 最 低 有 效 位 LSB 位 置 上 的 输入 xo、yo 及 co 到 最 高 有 效 位 
( most-significant-bit，MSB ) 位 置 上 的 输出 cv 与 w-ia 

使 用 图 9-2a 所 示 的 实现 电路 ，c 在 2 (zx-1) 个 门 延迟 后 得 到 ，s-; 需要 再 经 过 一 个 异 或 
门 延迟 后 得 到 。 而 最 终 的 进位 输出 c 需要 经 历 27 个 门 延迟 后 才能 得 到 。 因 此 ， 如 果 使 用 行 波 
进位 加 法 器 实现 图 9-3 所 示 的 加 法 /减法 部 件 ， 可 以 在 2n 个 门 延迟 后 得 到 所 有 的 求 和 位 ， 包 
括 了 输入 端 经 历 的 异 或 门 延迟 。 如 果 使 用 c 名 cwi 来 检测 溢出 ， 则 检测 结果 可 以 在 22 + 2 个 
门 延 迟 后 得 到 。 

有 两 种 方法 可 以 减少 加 法 器 的 延迟 。 第 一 种 方法 是 使 用 最 快 的 电子 工艺 。 第 二 种 方法 是 
使 用 一 种 称 为 超前 进位 网 络 的 逻辑 门 网 络 ， 下 面 我 们 将 描述 超前 进位 网 络 。 


超前 进位 加 法 
快速 加 法 器 电路 必须 加 速 进位 信号 的 产生 。 第 i 步 的 s; (和 ) 与 cr (进位 输出 ) 的 逻辑 
表达 式 为 ( 参见 图 9-1 ) 
Si= Xi yi Oo 
和 
Ci+l= Xiyit XiCit yici 
将 第 二 个 等 式 因 式 分 解 为 
Cit1= Xipit (Kit yi) ci 
因此 我 们 可 以 写 出 
Ctl=Grt Pe 
其 中 
Gi=xiyi lMR P=xity 
表达 式 G; 和 P; 分 别称 为 第 i 步 的 生成 ( generate ) 函数 与 传播 (propagate ) 函数 。 如 果 第 7 步 
的 生成 函数 等 于 1， 则 c ;1 = 1， 而 与 进位 输入 c 无 关 。 这 种 情况 发 生 在 x 与 y 都 为 1 时 。 传 
播 函 数 意 味 着 当 x; 或 者 y; 其 中 之 一 为 1 时 ， 进 位 输入 就 会 产生 进位 输出 。 所 有 的 G; 与 忆 函数 
都 可 以 在 工 与 了 操作 数 加 载 到 半 位 加 法 器 输入 端 后 独立 并 行 地 经 一 个 逻辑 门 延 迟 生 成 。 每 一 
位 段 包括 一 个 与 门 以 生成 G;， 一 个 或 门 以 生成 P;， 以 及 一 个 三 输入 端的 异 或 门 以 生成 s;。 仔 细 
观察 我 们 发 现 使 用 P;= xi 加 yi; 足以 实现 传播 函数 ， 这 样 会 得 出 更 简单 的 电路 。 这 个 公式 只 在 
Xi=yi 三 1 时 与 Pi=%+ 儿 不同 。 但 这 时 G;= 1， 所 以 Pi 是 0 是 1 无 关 紧 要 。 于 是 ,可 以 使 用 两 
个 两 输入 端 异 或 门 的 级 联 来 实现 s; 的 三 输入 端 异 或 功能 ， 图 9-4a 中 基本 的 B 单元 可 以 用 于 每 
一 位 段 的 计算 。 
使 用 以 一 1 为 下 标的 变量 扩展 c; ， 并 将 其 代入 ci, | 表达 式 中 ， 我 们 得 到 
Gi+1= Git+ PiGii + PiPiicii 
继续 这 种 扩展 ， 任 一 进位 变量 的 最 终 表 达 式 为 
本 和 三 合十 用 GT 寺 局 忆 Go 十 户 忆 有 Got PPraPoco (9-1 ) 
这 样 ， 所 有 的 进位 都 可 以 在 加 载 输入 操作 数 蕊 了 及 co 三 个 门 延迟 后 得 到 ， 因 为 生成 所 有 
Pi 与 G; 信号 只 需要 一 个 门 延 迟 ， 再 加 上 生成 c ;| 的 与 -或 电路 中 的 两 个 门 延 迟 。 再 经 过 一 个 
异 或 门 延迟 ， 将 得 到 所 有 的 求 和 位 。 因 此 , n 位 加 法 过 程 总 共 只 需要 四 个 门 延 迟 ， 而 与 无关。 
我 们 现在 考虑 一 下 4 位 加 法 器 的 设计 。 其 进位 可 以 实现 为 
C1= Go + Poco 
C2= G1+PiGo+ PiPoco 
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G=O+PO+PPIOo+PPPoco 
ca4= G3+ PG; + PPyG1 + PsPsPiGo + PP2PiPoco 





X3 3 如 » xl V1 X0 »0 





b ) 4 位 加 法 器 
图 9-4 4 位 超前 进位 加 法 器 


图 9-4b 显示 了 完整 的 4 位 加 法 器 。 进 位 在 标记 为 超前 进位 逻辑 的 部 件 中 产生 。 以 这 种 形式 实 
现 的 加 法 器 被 称 为 超前 进位 加 法 器 (carry-lookahead adder )。 该 加 法 器 对 所 有 的 进位 位 来 说 有 
3 个 门 延迟 ， 对 所 有 的 求 和 位 来 说 有 4 个 门 延迟 。 对 比 一 下 4 位 行 波 进位 加 法 器 ，s* 需要 7 个 
门 延迟 ， 而 cs 需要 8 个 门 延迟 。 

如 果 想 要 扩展 图 9-4b 的 超前 进位 加 法 器 设计 ， 使 它 能 够 对 更 长 的 操作 数 进行 加 法 运算 ， 
就 会 遇 到 门 的 扇 入 ( fan-in， 即 输入 端 数目 ) 限制 问题 。 由 表达 式 9-1， 我 们 看 到 最 后 的 与 门 和 
或 门生 成 c++: 时 需要 的 局 人 为 i+ 2。 在 4 位 加 法 器 中 ， 生 成 cs 需要 的 扇 人 为 S。 这 已 经 接近 实 
际 门 的 极限 了 。 所 以 图 9-4b 中 的 加 法 器 设计 不 能 简单 地 进行 扩展 以 处 理 长 操作 数 。 但 是 ， 可 
以 将 几 个 4 位 加 法 器 级 联 起 来 构造 较 长 的 加 法 器 ， 如 图 9-2c 所 示 。 

8 个 4 位 超前 进位 加 法 器 可 以 如 图 9-2c 那样 连接 起 来 构成 一 个 32 位 加 法 器 。 级 联 中 高 端 
的 4 位 加 法 器 生成 求 和 位 331、 $30、 $29、 528 以 及 进位 位 C32 所 需 的 延迟 计算 如 下 : 低 端 加 法 器 
的 进位 输出 cs 在 输入 操作 数 和 了 及 co 加 载 到 32 位 加 法 器 3 个 门 延迟 后 获得 。 之 后 ， 第 二 个 
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加 法 器 的 输出 cs 再 经 过 2 个 门 延 迟 后 获得 ，cu 需要 再 经 过 2 个 门 延迟 ,依次 类 推 。 最 后 ， 高 
端 4 位 加 法 器 的 进位 输入 cx 可 以 在 (6x2) + 3 = 15 个 门 延迟 后 获得 。 这 样 ，c> 和 高 端 加 法 器 
内 的 所 有 进位 还 需要 2 个 门 延迟 后 才能 得 到 ， 而 4 个 求 和 位 需要 再 经 历 1 个 门 延 迟 才 能 获得 ， 
一 共 是 18 个 门 延迟 。 作 为 对 比 ， 如 果 使 用 行 波 进位 加 法 器 ，sa: 与 ca 的 总 延迟 数 分 别 为 63 和 
64。 

下 面 将 对 刚才 讨论 的 级 联结 构 加 以 改进 ， 从 而 进一步 减少 延迟 。 关 键 的 思想 是 并 行 地 生 
成 进位 cd 、cs 等 ， 就 像 在 4 位 超前 进位 加 法 器 中 并 行 地 生成 c、cz、cs 和 cs 一 样 。 

高 层 的 生成 与 传播 函数 

在 刚才 讨论 的 32 位 加 法 器 中 ， 进 位 ce、cs、ciz. … 行 波 传递 进入 各 个 4 位 加 法 器 部 件 ， 每 
个 部 件 两 个 门 延迟 ， 这 与 行 波 进位 加 法 器 中 单个 进位 行 波 传递 进入 每 个 位 段 的 方式 非常 相 
像 。 通 过 使 用 高 层 的 生成 与 传播 函数 ， 就 有 可 能 使 用 超前 进位 方法 并 行 地 生成 进位 c4、cs、 
CI2、 ”oo 
9-5 显示 了 由 四 个 4 位 加 法 器 部 件 构成 的 16 位 加 法 器 。 这 些 部 件 提 供 了 新 的 输出 函数 
G 与 好， 其 中 下 = 0 对 应 于 第 一 个 4 位 部 件 , 上 = 1 对 应 于 第 二 个 4 位 加 法 器 部 件 ， 依 次 类 推 ， 
如 图 9-4b 和 图 9-5 所 示 。 在 第 一 个 部 件 中 ， 

Po = PsPsPiP, 
和 
Gh = G3+ P3G; + PyPyG1 + PPsP1Go 
第 一 层 的 G; 与 已 函数 决定 了 位 段 i 是 否 生成 或 传播 进位 ， 而 第 二 层 的 G 与 Pk 函数 决定 了 部 
件 磊 是 否 生 成 或 传播 进位 。 有 了 这 些 新 函数 ， 就 没有 必要 等 待 进位 行 波 传送 进入 4 位 加 法 器 部 
件 了 。 进 位 cs 由 图 9-5 所 示 的 超前 进位 电路 按 以 下 公式 生成 : 
ci6= G+ P3G+ P3P2GN+ P3PDOPNG0+ P3PaP' Poco 


X15-12 715-12 Xil-8  》11-8 X74 )7-4 X3-0 y3-0 


4 位 加 法 器 | 


超前 进位 逻辑 


ob py 





C16 co 





图 9-5 由 4 位 加 法 器 ( 见 图 9-4b ) 构造 的 16 位 超前 进位 加 法 器 


4 位 部 件 的 进位 输入 也 由 相似 的 简单 表达 式 并 行 地 生成 。cie。、ci2、cs 及 c4 的 表达 式 形式 分 别 与 
图 9-4b 超前 进位 电路 所 实现 的 c、cs、c 及 ci 相同 ， 只 是 变量 名 不 同 。 因 此 ， 图 9-5 中 超前 进 
位 电路 的 结构 与 图 9-4b 是 完全 相同 的 。 但 是 ， 由 4 位 加 法 器 部 件 内 部 产生 的 进位 ce、cs、cm、 
ci 在 图 9-5 中 并 不 需要 ， 因 为 在 这 里 它们 是 由 高 层 的 超前 进位 电路 生成 的 。 

现在 ， 我 们 考虑 16 位 超前 进位 加 法 器 产生 输出 所 需 的 延迟 。 超 前 进位 电路 产生 进位 所 需 
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的 延迟 比 生 成 G! 和 Px 函数 多 两 个 门 延 迟 。 而 生成 GU 和 Px 在 生成 G 和 Pi 之 后 分 别 需 要 两 
个 和 一 个 门 延 迟 。 因 此 ， 超 前 进位 电路 在 XY、7 了 及 co 加 载 到 输入 端 五 个 门 延迟 后 即 可 得 到 所 有 
的 进位 。 进 位 cis 是 在 图 9-5 中 高 端的 4 位 加 法 器 部 件 内 部 产生 的 ， 它 比 cs 晚 两 个 门 延 迟 ， 之 
后 sis 又 上 晚 了 一 个 门 延 迟 。 因 此 ，s1; 将 在 八 个 门 延迟 后 得 到 。 如 果 采 用 级 联 4 位 超前 进位 加 法 
器 部 件 的 方法 构造 16 位 加 法 器 ， 生 成 cis 和 su 的 延迟 分 别 为 九 个 和 十 个 门 延 迟 ， 而 在 图 9-5 
中 只 需要 五 个 和 八 个 门 延迟 。 

两 个 16 位 加 法 器 部 件 可 以 级 联 构成 一 个 32 位 加 法 器 。 这 时 ， 低 端 部 件 的 输出 ci 成 为 高 
端 部 件 的 进位 输入 。 其 延迟 要 比 以 前 讨论 过 的 32 位 加 法 器 少 得 多 ， 那 时 我 们 通过 级 联 八 个 4 
位 加 法 器 来 构造 32 位 加 法 器 。 回 顾 一 下 ， 在 该 加 法 器 中 ，si: 在 18 个 门 延 迟 后 得 到 ，c3; 在 17 
个 门 延迟 后 得 到 。 而 级 联 两 个 16 位 加 法 器 的 延迟 分 析 如 下 : 我 们 刚刚 讨论 过 ， 低 端 部 件 的 进 
位 输出 cie 在 五 个 门 延迟 后 得 到 。 然 后 ， 高 端 部 件 的 cxs 和 cs 在 随后 的 两 个 门 延迟 后 得 到 ，c3i 
在 cxs 之 后 的 两 个 门 延迟 后 得 到 。 因 此 o 在 总 共 九 个 门 延 迟 后 得 到 ，s: 在 十 个 门 延迟 后 得 到 。 
也 就 是 说 ，s3 和 c3 分 别 在 十 个 和 七 个 门 延 迟 后 获得 。 作 为 比较 ， 如 果 使 用 八 个 4 位 加 法 器 级 
联 构成 的 32 位 加 法 器 ， 获 得 相同 的 结果 则 分 别 需 要 18 和 17 个 门 延迟 。 

从 第 一 层 的 G; 和 Pi 函数 生成 第 二 层 的 Gx 和 Px 函数 所 用 的 推理 可 以 用 来 从 Gk 与 PY 也 
数 生成 第 三 层 的 Gx 和 Px 函数 。 这 两 个 第 三 层 的 函数 在 图 9-5 中 被 表示 为 超前 进位 逻辑 的 输 
出 。 使 用 四 个 图 9-5 中 的 16 位 加 法 器 ， 再 加 上 产生 进位 ci6。、c3z、css 和 ca 的 超前 进位 逻辑 电路 ， 
就 可 以 构成 一 个 64 位 加 法 器 。 使 用 上 面 对 16 位 加 法 器 推理 的 扩展 ， 可 以 证 明 这 个 加 法 器 的 延 
迟 为 se 需要 12 个 门 延 迟 ，ca 需要 7 个 门 延 迟 。( 参见 习题 9.7。) 


9.3 无 符号 数 乘法 

图 9-6a 显示 了 二 进 制 系统 中 手工 进行 整数 乘法 的 普通 算法 。 两 个 n 位 无 符号 数 的 积 小 于 
等 于 2n 位 ， 因 此 如 图 所 示 ， 本 例 中 两 个 4 位 数 的 积 为 8 位 。 在 二 进 制 系统 中 ， 被 乘 数 与 乘 数 
的 一 位 相 乘 是 很 容易 的 。 如 果 乘 数位 为 1， 则 在 适当 移 位 的 位 置 上 放 和 人 被 乘 数 。 如 果 乘 数位 为 
0， 则 放 入 0， 如 示例 的 第 三 行 。 然 后 从 右 至 左 将 各 位 列 相 加 ， 每 次 计算 一 位 ， 并 在 各 位 列 之 
间 传 递 进位 值 ， 从 而 得 到 乘积 。 


9.3.1 阵列 乘法 器 

无 符号 操作 数 的 二 进 制 乘法 可 以 用 二 维 组 合 逻 辑 阵列 实现 ，4 位 操作 数 的 乘法 如 图 9-6b 
所 示 。 每 个 单元 的 主要 组 成 部 分 是 一 个 全 加 器 FA。 每 个 单元 的 与 门 根 据 乘 数位 9 的 值 决定 被 
乘 数位 mj 是 否 要 加 到 传人 的 部 分 乘积 位 上 。 如 果 q; = 1， 每 一 行 上 (其 中 0 冬 i 科 3) 将 (经 过 
适当 移 位 的 ) 被 乘 数 加 到 传人 的 部 分 乘积 PPi 上 ， 以 生成 传 出 的 部 分 乘积 PP(i + 1)。 如 果 9 = 
0， 则 PPi 就 不 经 改变 地 垂直 向 下 传 出 。PP0 为 全 0， 而 PP4 为 乘积 结果 。 被 乘 数 沿 着 倾斜 的 信 
号 传输 路 径 每 行 左 移 一 个 位 置 。 我 们 注意 到 ， 不 同 于 前 面 描述 的 逐 列 进行 的 普通 手工 加 法 ， 阵 
列 电路 中 的 加 法 是 逐 行进 行 的 - 

最 坏 情况 下 的 信号 传输 延迟 路 径 是 从 阵列 的 右上 角 到 阵列 左下 角 的 高 位 乘积 位 。 这 条 关 
键 路 径 包括 每 行 右 端的 两 个 单元 和 最 底 行 的 所 有 单元 ， 呈 现 出 阶梯 状 模式 。 假 设 从 全 加 器 部 件 
FA 的 输入 到 输出 需要 两 个 门 延迟 ， 则 对 nxn 阵列 而 言 ， 该 关键 路 径 的 总 延迟 为 6(n 一 1)-1 个 
门 延迟 ， 包 括 所 有 单元 中 初始 的 与 门 延迟 。( 参见 习题 9.8 ) 阵列 的 第 一 行 不 需要 全 加 器 ， 因 为 
传人 的 部 分 积 PP0 为 0。 在 推导 延迟 表达 式 时 已 经 考虑 了 这 一 点 。 


1 1 G1 (13) 被 乘 数 M 
沁 时 漆 二 (1D) 乘 数 Q 
me 
1101 
0000 
i if@i 
10001111 (143) 乘积 了 


a ) 手工 乘法 运算 


部 分 乘积 0 m0 m0 ml0 mo 
( PPO0 ) 








进位 输出 


传 出 的 部 分 乘积 位 [PP (i+1 ) ] 
b ) 阵列 实现 
图 9-6 无 符号 二 进 制 操作 数 的 阵列 乘法 


9.3.2 顺序 电路 乘法 器 

刚刚 所 描述 的 组 合 阵列 乘法 器 在 计算 实际 大 小 的 数字 ( 如 32 位 或 64 位 数字 ) 时 ， 使 用 
了 很 多 的 逻辑 门 。 两 个 n 位 数 的 乘法 还 可 以 在 一 个 使 用 单个 位 加 法 器 的 顺序 电路 中 实现 。 

图 9-7a 的 框图 显示 了 顺序 乘法 电路 的 硬件 组 成 。 该 电路 通过 使 用 一 个 n 位 加 法 器 进行 
次 运算 来 实现 图 9-6b 中 4 行 行 波 进位 加 法 器 所 执行 的 空间 加 法 。 寄 存 器 A 和 Q 是 移 位 寄存 
器 ， 如 图 中 所 示 连 接 起 来 ， 它 们 一 起 容纳 部 分 积 PPi， 而 乘 数 位 gq; 产生 “加 /不 加 ”信和 号。 该 
信号 使 得 多 路 复 用 器 MUX 选择 0 ( 当 q=0 时 ) 或 被 乘 数 M ( 当 g=1 时) 加 到 PPi 上 ， 从 而 
生成 PP (i + 1)。 乘 积 需 要 n 个 周期 计算 。 从 初始 向 量 PP0 ( 寄存 器 A 中 的 n 个 0) 开始 ,在 每 
一 周期 中 部 分 积 PPi 的 长 度 都 增长 一 位 。 加 法 器 的 进位 输出 存储 在 触发 器 C 中 ， 它 在 寄存 器 


A 的 左 侧 。 开 始 时 ， 乘 数 被 装载 到 寄存 器 Q 中 ， 被 乘 数 被 装载 到 寄存 器 M 中 , 而 C 和 A 被 清 
零 。 在 每 一 周期 结束 时 ，C、A 和 Q 右 移 一 位 以 容纳 部 分 积 的 增长 ， 同 时 乘 数 移出 寄存 器 Q。 
由 于 这 种 移 位 ， 寄 存 器 Q 的 最 低 有 效 位 (LSB ) 位 置 上 的 乘 数位 9 才 可 以 在 正确 的 时 刻 生成 
“加 /不 加 ”信和 号， 比如 第 一 个 周期 的 go 到 第 二 个 周期 的 qi 等 等 。 这 些 乘 数 位 使 用 过 后 就 被 右 
移 操作 丢弃 了 。 注 意 ， 加 法 器 的 进位 输出 是 PP (i + 1) 的 最 左 位 ， 它 必须 保存 在 触发 器 C 中 ， 
并 随 A 和 Q 的 内 容 一 起 右 移 。n 个 周期 之 后 ， 乘 积 的 高 位 部 分 保存 在 寄存 器 A 中 ， 而 低位 部 
分 保存 在 寄存 器 Q 中 。 图 9-7b 显示 了 以 这 种 硬件 安排 执行 图 9-6a 中 的 乘法 示例 。 
寄存 器 A ( 初始 为 0) 





控制 序列 
发 生 器 









被 乘 数 M 
a) 寄存 器 配置 
M 
初始 设置 
[oj [ooo0o0 1011 
C A Q 
0 本 OL 加 
0 0110 i 移 位 } 第 一 个 周期 
1 0011 i } 一 个 
0 1001 ne 第 二 个 周期 
0 1001 区 不 加 } 到 
0 0 100 下 We 第 三 个 周期 
1 0001 i i 1 加 
0 1000 IT 移 位 } 第 四 个 周期 
C—O 
乘积 


b ) 乘法 示例 
图 9-7 “二进制 顺序 乘法 电路 
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9.4 有 符号 数 乘法 

我 们 现在 讨论 补 码 操作 数 的 乘法 ， 它 生成 长 度 加 倍 的 乘积 。 总 的 策略 依然 是 由 乘 数 位 选 
择 被 乘 数 累加 部 分 积 的 方法 。 

首先 ， 考 虑 正 乘 数 和 负 被 乘 数 的 情况 。 当 我 们 将 负 的 被 乘 数 加 到 部 分 积 时 ， 必 须 将 被 乘 
数 符号 位 的 值 扩展 到 乘积 的 最 左边 。 图 9-8 给 出 了 一 个 例子 ， 其 中 5 位 有 符号 操作 数 -13 为 被 
乘 数 ， 乘 以 +11 得 到 了 10 位 的 乘积 -143。 被 乘 数 的 符号 扩展 用 灰色 显示 。 如 果 前 面 讨论 过 的 
硬件 能 被 扩大 以 提供 部 分 积 的 符号 扩展 ， 那 么 它 就 可 以 接受 负 的 被 乘 数 。 


符号 扩展 用 
灰色 显示 





图 9-8 负 被 乘 数 的 符号 扩展 


对 于 负 乘 数 ， 直 接 的 解决 办 法 就 是 形成 乘 数 与 被 乘 数 的 补 码 ， 并 按照 正 乘 数 的 情况 进行 
运算 。 可 以 这 样 做 是 因为 对 两 个 操作 数 都 求 补 并 不 改变 乘积 的 值 或 符号 。 下 面 我 们 将 讨论 一 种 
对 负 乘 数 和 正 乘 数 效果 同样 好 的 技术 ， 称 为 Booth 算法 。 


Booth 算法 

Booth 算法 [1] 生成 22 位 的 乘积 ， 而 且 它 以 统一 的 方式 对 待 正 负 补 码 形式 的 n 位 操作 数 。 
为 了 理解 该 算法 的 基本 原理 ， 考 虑 一 个 乘法 运算 ， 其 中 乘 数 为 正 数 而 且 有 唯一 的 一 块 区 域 为 
全 1， 例 如 0011110。 为 了 得 到 乘积 ， 在 标准 程序 中 需要 将 四 个 适当 移 位 的 被 乘 数 相 加 。 但 是 ， 
通过 将 该 乘 数 看 作 是 两 个 数 的 差 可 以 减少 所 需 操作 的 数目 : 


0100000 (32) 
- 0000010 (2) 
0011110 (30) 


这 意味 着 将 被 乘 数 的 2 倍 与 2 倍 的 补 码 相 加 即 可 得 到 乘积 。 为 了 方便 ， 我 们 可 以 将 前 面 的 乘 
数 重新 编码 为 0+ 1000-10， 并 以 此 描述 所 需 操 作 的 顺序 。 

一 般 而 言 ， 在 Booth 算法 中 ， 从 右 至 左 扫描 乘 数 ， 由 0 变 为 1 时 将 移 位 的 被 乘 数 乘 以 -1， 
由 1 变 为 0 时 将 移 位 的 被 乘 数 乘 以 +1。 图 9-9 演示 了 刚才 所 讨论 例子 的 普通 算法 与 Booth 算 
法 。 很 明显 ，Booth 算法 可 以 扩展 到 包含 任意 块 数 1 的 乘 数 ， 包 括 将 单独 的 一 个 1 视 为 一 块 的 
情况 。 图 9-10 展示 了 对 乘 数 进行 重 编码 的 另 一 个 例子 。 当 乘 数 的 最 低 有 效 位 为 1 时， 假设 其 
右 方 隐 含 地 包括 一 个 0。Booth 算法 还 可 以 直接 应 用 于 负 乘 数 的 情况 ， 如 图 9-11 所 示 。 

为 了 证 明 Booth 算法 对 负 乘 数 的 正确 性 ， 我 们 使 用 补 码 系统 中 负数 表示 的 以 下 性 质 : 假设 
负数 天 中 最 左 方 的 0 在 位 位 置 上 处 ， 即 

X= 11:…10x: ix 


1348| 
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图 9-11 负 乘 数 的 Booth 乘法 
则 针 的 值 为 


VX) =—2 +x X22 + .+xox 2 
V(X) 表达 式 的 正确 性 可 以 这 样 证 明 ， 即 将 看 作 以 下 两 个 数 之 和 : 


11 … 100000… 0 
+ 00 … O00xk_-1 … xo 
X= 11… 10x 1 -x0 


其 中 上 面 的 数 是 -2'! 的 补 码 表示 。 现 在 ， 重 编码 的 乘 数 的 一 部 分 就 是 和 式 中 下 面 的 数 ， 并 且 
其 上 + 1 位 为 -1。 例 如 ， 乘 数 110110 可 以 重 编码 为 0-1+ 10-10。 
图 9-12 总 结 了 对 乘 数 重 编码 的 Booth 技术 。 由 011…110 至 +100…0=-10 的 转换 称 为 跳 过 


第 9 章 算术 运算 :+ 229 


1 位 ( skipping over 1s )。 这 个 术语 是 由 于 将 乘 数 分 解 成 几 个 连续 全 1 的 块 区 域 的 情况 得 来 的 。 
只 需 将 被 乘 数 ( 求 和 项 ) 几 种 移 位 的 变 体 相 加 就 可 得 到 ” 一 一 六 一 

乘积 ， 因 此 加 速 了 乘法 运算 。 但 是 ， 在 最 坏 情况 下 ， 即 ms 第 ;位 选择 的 

乘 数 中 的 1 和 0 交 蔡 时 ， 乘 数 的 每 一 位 都 将 选择 一 个 求 ”| 第 位 第 六 1 位 被 乘 数 变 体 

和 项 。 实 际 上 ， 它 产生 的 求 和 项 比 不 使 用 Booth 算法 时 [6 0 0xM 

还 要 多 。 图 9-13 显示 了 最 坏 情况 、 普 通 情 况 和 较 好 情 0 1 | +1xM 
1 0 | 
1 1 











况 下 的 16 位 的 乘 数 。 | 








-lxM 
Booth 算法 有 两 个 吸引 人 的 特征 。 第 一 ， 它 以 统一 OxM | 
的 方式 处 理 正 负 乘 数 ; 第 二 ， 当 乘 数 中 包含 很 多 大 块 的 
全 1 区 域 时 ， 它 的 效率 很 高 图 9-12 ”Booth 乘 数 重 编码 表 
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图 9-13 ”Booth 重 编码 的 乘 数 


9.5 快速 乘法 
现在 我 们 讲述 两 种 提高 乘法 运算 速度 的 技术 。 第 一 种 技术 保证 对 于 位 操作 数 ， 参 与 加 
法 的 求 和 项 ( 被 乘 数 的 不 同 变 体 ) 的 最 大 数目 为 w2。 第 二 种 技术 是 将 求 和 项 并 行 相 加 。 


9.5.1 乘 数位 偶 重 编码 

乘 数 位 偶 重 编码 ( bit-pair recoding ) 技术 可 将 每 对 乘 数位 用 最 多 一 个 求 和 项 来 表示 。 它 直 
接 来 源 于 Booth 算法 。 将 Booth 算法 重 编码 的 乘 数 位 组 成 对 时 ， 可 以 观察 到 :对 (+1 -1) 与 对 (0 
+1) 是 等 价 的 。 也 就 是 说 ， 不 是 将 移 位 位 置 i 上 -1 倍 的 被 乘 数 M 与 位 置 i+ 1 上 +1 倍 的 M 相 
加 ， 而 是 在 位 置 i 加 入 +1 xM， 也 可 以 得 到 相同 的 结果 。 其 他 的 例子 有 : (+1 0) 与 (0 +2) 等 价 ， 
(-1 +1) 与 (0 -1) 等 价 ， 等 等 。 这 样 ， 如 果 从 右边 开始 对 Booth 算法 重 编码 过 的 乘 数 每 次 检查 
两 位 ， 那 么 乘 数 可 以 重 写 为 另 一 种 形式 ， 该 形式 对 于 每 一 对 乘 数位 最 多 只 需要 将 一 个 被 乘 数 加 
到 部 分 积 中 。 图 9-14a 显示 了 对 图 9-11 中 乘 数 的 位 偶 重 编码 ， 而 图 9-14b 显示 了 在 所 有 可 能 的 
情况 下 被 乘 数 的 选择 决策 表 。 图 9-15 使 用 乘 数 的 位 偶 重 编码 重新 计算 了 图 9-11 中 的 乘法 。 


9.5.2 ” 求 和 项 的 进位 保留 加 法 


在 乘法 中 需要 将 几 个 求 和 项 相 加 ， 一 种 称 为 进位 保留 加 法 ( carry-save addition，CSA ) 的 
技术 可 以 用 来 加 速 这 一 过 程 。 考 虑 图 9-16a 中 的 4x 4 乘法 阵列 。 这 个 结构 使 用 的 是 图 9-6 所 
示 的 阵列 形式 ， 它 的 第 一 行 只 包含 产生 四 个 输入 mqo、Mm24o、Mmiqo 和 moqo 的 与 门 。 
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a ) 源 于 Booth 重 编码 的 位 偶 重 编码 示例 
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图 9-15 


b ) 被 乘 数 选择 决策 表 
图 9-14 乘 数位 偶 重 编码 
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只 需 m2 个 求 和 项 的 乘法 
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我 们 可 以 不 让 进位 在 各 行 中 波动 ， 而 是 将 它们 “保存 ”起 来 ， 并 在 正确 的 权重 位 置 上 将 
它们 引入 到 下 一 行 中 ， 如 图 9-16b 所 示 。 这 释放 了 第 一 行 前 三 个 全 加 器 中 每 个 全 加 器 的 一 个 输 
入 端 。 这 些 输入 端 用 来 引入 第 三 个 求 和 项 的 位 mg;、m19;、moq2。 现 在 ,第 二 行 前 三 个 全 加 器 。 1353 
中 每 个 全 加 器 的 两 个 输入 端 装载 了 来 自 第 一 行 的 和 与 进位 输出 。 第 三 个 输入 端 用 来 引入 第 四 个 
求 和 项 的 位 m2q3、 Migq3、mog3o 第 三 和 第 四 个 求 和 项 的 高 端 位 maq2 与 m3qs 被 引入 到 第 二 与 第 
三 行 左 侧 其 余 空闲 的 全 加 器 输入 端 中 。 来 自 第 二 行 的 保留 进位 位 及 求 和 位 现在 加 到 第 三 行 的 行 
波 进 位 加 法 器 中 ， 从 而 得 到 最 终 的 乘积 位 。 

进位 保留 阵列 的 延迟 比 行 波 进位 阵列 的 延迟 要 小 一 些 。 这 是 因为 每 一 行 的 输出 向 量 9$ 和 C 
是 在 一 个 全 加 器 延迟 中 并 行 生成 的 。 延 迟 的 减少 量 将 在 习题 9.15 中 考虑 。 


0 1390 m2qg0 m1iqo moqgo 
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b ) 进位 保留 阵列 
图 9-16 一 个 4x4 乘 法 器 的 行 波 进位 与 进位 保留 阵列 


9.5.3 ”使 用 3-2 简化 器 的 求 和 项 加 法 树 


当 处 理 比 图 9-16 中 所 考虑 的 操作 数 更 长 的 操作 数 时 ， 有 可 以 更 显著 地 减 小 延迟 的 方法 。 
我 们 可 以 将 三 个 求 和 项 分 为 一 组 ， 并 对 每 个 组 并 行 地 执行 进位 保留 加 法 ， 从 而 在 一 个 全 加 器 延 
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述 中 得 到 一 系列 5 与 C 向 量 。 这 里 我 们 将 全 加 器 电路 简称 为 加 法 器 。 然 后 将 所 有 的 S 和 C 向 
量 分 为 三 个 一 组 ， 对 它们 执行 进位 保留 加 法 ， 在 一 个 加 法 器 延迟 中 生成 更 深 一 层 的 5 与 C 问 
量 。 我 们 继续 这 个 过 程 ， 直 到 只 剩 下 两 个 向 量 。 三 个 求 和 项 中 每 个 位 位 置 上 的 加 法 器 被 称 为 
3-2 简化 器 ( 3-2 reducer )， 将 求 和 项 数目 减 为 2 的 逻辑 电路 结构 被 称 为 CSA 树 (CSA tree )， 
如 Wallace 在 参考 文献 [2] 中 所 描述 的 。 最 后 两 个 S$ 和 C 向 量 可 以 使 用 超前 进位 加 法 器 相 加 ， 
产生 最 终 的 乘积 。 

考虑 图 9-17 所 示 的 例子 ， 在 两 个 
6 位 的 无 符号 数 相 乘 且 乘 数 的 全 部 位 均 
为 1 时 ， 对 六 个 被 乘 数 的 移 位 变 体 求 和 。 
图 9-18 使 用 进位 保留 加 法 对 六 个 求 和 项 
4，B，…, 严 求 和 。 两 幅 图 中 的 “ 方 框 ” 
指示 了 相同 的 操作 数位 ， 并 显示 了 如 何 对 
它们 使 用 进位 保留 加 法 生成 求 和 位 与 进位 
位 。 示 例 中 执行 了 三 个 层次 的 进位 保留 加 

- 示 。 显示 FS 个 

We 个 图 9-17 展示 图 9-18 中 进位 保留 加 法 的 乘法 示例 
加 法 器 延迟 得 到 最 终 的 两 个 向 量 $4 与 G4。 将 5; 与 Cs 相 加 生成 最 终 乘 积 的 普通 加 法 操作 可 以 
使 用 超前 进位 加 法 器 来 完成 。 
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图 9-18 ”使 用 进位 保留 加 法 计算 图 9-17 中 的 乘法 示例 
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使 用 图 9-19 所 示 的 树 结构 时 乘法 器 的 延迟 比 使 用 图 9-16b 所 示 的 阵列 结构 时 要 少 。 当 求 
和 项 的 数目 很 大 时 ， 延 迟 的 减少 是 比较 显著 的 。 例 二 下 再 通 音 员 
如 ， 按 照 图 9-19 的 模式 将 32 个 求 和 项 相 加 ， 在 最 下 第 层 CSA 
终 的 加 法 操作 前 只 需要 八 层 的 3-2 简化 操作 。 一 般 Cc Ss ci 8 


2 1 1 
而 言 ， 可 以 证 明 将 个 求 和 项 降 为 最 终 求 和 以 生成 | 一 RCSA 
乘积 的 两 个 向 量 大 约 需要 1.7logxk-1.7 层 的 3-2 简 全 
化 操作 ( 参见 9.10 节 中 的 例 93 )。 = 
我 们 应 该 注意 ， 当 使 用 有 符号 数 乘法 以 及 乘 Cc Ss 
数 的 Booth 重 编码 技术 时 ， 可 能 会 涉及 负 的 求 和 [= 最 终 的 加 法 
项 ， 这 就 需要 在 求 和 项 进入 简化 树 之 前 对 它们 进行 中 
符号 扩展 。 同 时 ， 如 果 使 用 了 乘 数 的 位 偶 重 编码 技 pa. 
术 ， 那 么 需要 相 加 的 求 和 项 的 数目 将 会 减少 。 图 9-19 图 9-18 中 进位 保留 加 法 操作 的 图 示 


3-2 简化 器 不 是 构建 简化 树 的 唯一 逻辑 电路 ， 还 可 以 使 用 4-2 简化 器 和 7-3 简化 器 。 下 一 
小 节 将 描述 4-2 简化 器 ，7-3 简化 器 将 在 习题 9.17 中 探讨 。 


9.5.4 使 用 4-2 简化 器 的 求 和 项 加 法 树 

从 图 9-19 中 我 们 可 以 发 现 ， 使 用 3-2 简化 器 的 CSA 树 ， 其 各 层 间 的 互 连 模式 是 不 规则 
的 。 通 过 使 用 4-2 简化 器 [3]， 我 们 可 以 得 到 一 个 结构 更 加 规则 的 树 ， 当 求 和 项 的 数目 是 2 的 
寡 时 则 更 是 如 此 。 处 理 器 的 ALU 在 进行 乘法 运算 时 通常 就 是 采用 这 种 方式 。 例 如 ， 如 果 在 每 
个 简化 层 上 使 用 4-2 简化 器 将 32 个 求 和 项 缩减 到 2 个， 那么 只 需要 四 层 即 可 。 树 的 结构 很 规 
则 ， 四 层 的 输出 依次 为 16、8、4 和 2 个 求 和 项 。 而 如 果 使 用 3-2 简化 器 ， 则 需要 八 层 ， 并 且 
各 层 间 的 线路 连接 都 很 不 规则 。 在 实现 VLSI 电路 时 ， 规 则 的 树 结构 可 以 使 逻辑 电路 和 线路 的 
布局 更 加 便利 。 

让 我 们 来 考虑 一 下 在 参考 文献 [3] 中 提出 的 4-2 简化 器 的 设计 。 对 四 个 求 和 项 中 四 个 相同 
权重 的 位 w、x、y 和 z 进行 加 法 计算 ， 会 产生 一 个 在 0 到 4 范围 内 的 值 。 这 个 值 无 法 用 一 个 求 
和 位 s 和 一 个 单独 的 进位 位 c 来 表示 。 然 而 ， 我们 可 以 使 用 第 二 个 进位 cou (与 c 的 权重 相同 )， 
与 s 和 cc 一 起 来 表示 0 到 5 范围 内 的 任意 值 。 而 这 可 以 满足 我 们 这 里 的 要 求 。 

我 们 不 希望 向 下 一 个 简化 层 发 送 三 个 输出 位 ， 那 样 就 是 4-3 简化 器 了 ， 它 将 比 3-2 简化 器 
提供 更 少 的 简化 。 解 决 方法 是 将 cou 横向 发 送 给 同一 简化 层 中 权重 较 高 的 相 邻 位 位 置 上 的 4-2 
简化 器 。 这 样 ， 每 一 个 4-2 简化 器 必须 有 第 五 个 输入 cs,， 它 是 同一 简化 层 中 权重 较 低 的 相 邻 位 
位 置 上 的 4-2 简化 器 的 cou 输出 . 

设计 4-2 简化 器 的 最 后 一 个 要 求 是 cou 的 值 不 能 依赖 于 ci 的 值 。 这 是 一 个 关键 的 要 求 ， 如 
果 没 有 这 个 要 求 ， 进 位 将 会 在 一 个 简化 层 中 横向 波动 ， 这 样 就 完全 背离 了 在 一 个 较 短 的 固定 延 


述 时 间 内 并 行 地 简化 求 和 项 的 目的 。4-2 简化 器 部 件 w x y z 
如 图 9-20 所 示 。 
综 上 所 述 ， 一 个 4-2 简化 器 的 具体 设计 要 求 
e s、c 和 cou 这 三 个 输出 代表 了 五 个 输入 的 算 
术 和 ， 即 
永生 这 二 2+ 三 $+ 2(6 +Cn) c( 进位) (和) 


其 中 所 有 的 运算 符 都 是 算术 运算 符 。 图 9-20 4-2 简化 器 部 件 
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e 输出 s 是 通常 的 和 变量 ; 也 就 是 说 ，* 是 这 五 个 输入 变量 的 异 或 函数 。 
e 横向 进位 cou 必须 独立 于 cn。 它 只 是 w、 
x、y 和 z 这 四 个 输入 变量 的 函数 。 
满足 上 述 条 件 的 两 个 进位 输出 有 很 多 组 ， 这 
B58] ”里 我 们 给 出 一 组 便于 描述 的 进位 输出 。 首 先 ， 当 
输入 变量 w、x、y 和 z 中 的 两 个 或 两 个 以 上 都 等 
于 1 时 ,将 横向 的 进位 输出 cou 赋值 为 1。 然后 ， 
为 了 满足 算术 条 件 ， 另 一 个 进位 输出 c 也 确定 了 。 
满足 这 些 条 件 的 完整 真 值 表 如 图 9-21 所 示 。 这 个 
表 的 表示 形式 与 附录 A 中 使 用 的 普通 形式 不 同 ， 
其 中 , w、x、y 和 z 这 四 个 输入 不 是 按照 二 进 制 
数字 的 顺序 列 出 的 ， 而 是 按 组 的 方式 列 出 ， 每 组 
中 值 为 1 的 输入 个 数 相同 。 这 样 我 们 可 以 很 容易 
地 看 出 如 何 指定 输出 以 满足 给 定 的 条 件 。 根 据 该 
表 ， 我 们 可 以 推导 出 一 个 逻辑 门 网 络 。 


9.5.5 快速 乘法 总 结 


现在 我 们 总 结 一 下 快速 乘法 技术 。 首 先 ， 由 
Booth 算法 发 展 而 来 的 乘 数位 偶 重 编码 技术 可 将 
求 和 项 的 数目 减少 为 原来 的 2。 然后， 利用 一 图 9-21 4-2 简化 器 真 值 表 
个 简化 层 数目 相对 较 少 的 简化 树 中 进一步 将 求 和 项 的 数目 降 为 >。 最终 的 乘积 可 以 通过 使 用 超 
前 进位 加 法 器 进行 一 次 加 法 运算 得 到 。 高 性 能 处 理 器 的 设计 者 已 经 在 各 种 不 同 的 组 合 中 使 用 了 
所 有 这 三 种 技术 一 一 乘 数 的 位 偶 重 编码 、 求 和 项 的 并 行 简化 和 超前 进位 加 法 一 一 来 减少 执行 乘 
法 操作 所 需 的 时 间 。 


9.6 ”整数 除法 

在 9.3 节 讨 论 无 符号 数 乘法 时 ， 我 们 将 手工 计算 和 
逻辑 电路 计算 乘法 操作 的 方法 联系 了 起 来 。 在 这 里 将 使 
用 同样 的 方法 讨论 整数 除法 。 我 们 将 详细 地 讨论 无 符号 
数 除法 ， 然 后 再 对 有 符号 操作 数 的 情况 作 一 般 性 的 说 明 。 

图 9-22 显示 了 同一 数值 的 十 进 制 除法 与 二 进 制 除法 
的 示例 。 先 来 看 一 下 十 进 制 除法 的 情况 。 商 中 的 2 是 由 
以 下 推理 确定 的 : 首先 ， 试 着 用 13 去 除 2， 但 这 不 行 。 
然后 ， 试 着 用 13 去 除 27。 我 们 试探 着 将 13 乘 以 2 得 到 
26， 而 且 27-26 = 1 小 于 13， 所 以 上 商 2 并 进行 所 需 的 减法 。 被 除数 的 下 一 位 4 被 放下 来 ， 最 
后 我 们 用 13 去 除 14， 余 数 为 1。 也 可 以 用 类 似 的 方式 来 讨论 二 进 制 除法 ， 而 且 由 于 商 中 的 各 
位 只 可 能 为 0 或 1， 所 以 二 进 制 的 除法 运算 更 简单 。 

用 这 种 笔算 方法 实现 除法 的 电路 操作 如 下 : 它 先 将 除数 与 被 除数 适当 地 对 齐 并 执行 减法 。 
如 果 余数 为 0 或 为 正 ， 则 可 确定 商 位 为 1， 而 余数 用 被 除数 的 下 一 位 进行 扩展 ， 除 数 被 重新 定 
位 ， 然 后 再 执行 下 一 次 减法 。 如 果 余 数 为 负 ， 则 可 确定 商 位 为 0， 被 除数 加 回 除数 以 恢复 原 
值 ， 然 后 除数 被 重新 定位 ， 执 行 下 一 次 减法 。 这 被 称 为 恢复 除法 ( restoring division ) 算法 。 
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图 9-22 ”笔算 除法 示例 
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1.， 恢复 除法 

图 9-23 显示 了 实现 刚刚 讨论 的 恢复 除法 算法 的 逻辑 电路 装置 。 注 意 它 与 图 9-7 所 示 的 乘 
法 电路 非常 相似 。 操 作 开始 时 , 位 正 除数 被 加 载 到 寄存 器 M 中 ， 而 n 位 正 被 除数 被 加 载 到 寄 
存 器 Q 中 。 寄 存 器 A 被 清 零 。 除 法 结束 后 ，n 位 的 商 将 存放 在 寄存 器 Q 中 ， 而 余数 则 存放 在 
寄存 器 A 中 。 所 需 的 减法 操作 可 以 使 用 补 码 运算 方便 地 完成 。A 和 M 左边 的 附加 位 位 置 在 减 
法 过 程 中 存放 符号 位 。 下 面 的 算法 执行 了 恢复 除法 。 





控制 序列 
发 生 器 





执行 以 下 三 步 n 次 : 
1) 将 A 与 Q 左 移 一 位 。 
2 ) 从 A 中 减 去 M， 并 将 结果 放 回 A。 





3 ) 如 果 A 的 符号 为 1!1， 上 商 qo 为 0， 
并 将 M 加 回 到 A 中 ( 即 恢 复 A ); 否则 上 0 
商 qgo 为 1。 图 9-24 显 示 了 使 用 图 9-23 中 1 
的 电路 进行 4 位 除法 运算 的 例子 。 ! 

2. 不 恢复 除法 

在 不 成 功 的 减法 之 后 避免 恢复 A 的 





值 可 以 提高 恢复 除法 算法 的 效率 。 如 果 结 
果 为 负 ， 则 减法 被 说 成 是 不 成 功 的 。 考 虑 
前 面 算法 中 减法 操作 之 后 所 发 生 的 操作 步 
又 。 如 果 A 为 正 ， 左 移 并 减 去 M， 也 就 是 
执行 2A-M。 如 果 A 为 负 ， 就 执行 A+ M 
来 恢复 它 ， 然 后 再 左 移 并 减 去 M。 这 跟 执 
行 2A + M 是 等 价 的 。 正 确 的 操作 执行 后 ， 
do 位 就 被 恰当 地 置 为 0 或 1。 我 们 可 以 用 
下 面 的 算法 对 不 恢复 除法 (non-restoring 
division ) 作 一 个 总 结 。 

第 1 阶段 :执行 以 下 两 个 步骤 nn 次。 

1) 如 果 A 的 符号 为 0, 将 A 和 Q 左 图 9-24 ”恢复 除法 示例 
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2 ) 现在 ， 如 果 A 的 符号 为 0， 上 商 
go 为 1; 否则 ， 上 商 qo 为 0。 

第 2 阶段 : 如 果 A 的 符号 为 1， 将 M 
加 到 A 上 。 

在 执行 第 1 阶段 4 个 周期 之 后 ， 需 
要 执行 第 2 阶段 以 便 在 A 中 设置 适当 的 
正 余数 。 图 9-23 的 逻辑 电路 也 可 以 用 来 
执行 这 个 算法 ， 除 了 不 再 需要 恢复 操作 之 
外 。 第 1 阶段 的 每 个 周期 只 执行 一 次 加 法 
或 减法 操作 ， 第 2 阶段 可 能 还 要 执行 最 后 
一 次 加 法 操作 。 图 9-25 显示 了 使 用 不 恢 
复 除 法 算法 计算 图 9-24 中 示例 的 情况 。 

对 有 符号 操作 数 进行 除法 运算 并 没 
有 与 有 符号 数 乘法 相对 应 的 简单 算法 。 
在 除法 中 ， 可 以 将 操作 数 转变 为 正 数 。 
在 使 用 了 上 面 讨论 的 一 种 算法 之 后 ， 如 
果 有 需要 再 将 商 和 余数 的 符号 进行 调整 。 


9.7 浮 点 数 及 其 运算 


第 1 章 描述 了 使 用 浮 点 数 的 动机 ， 并 
指出 了 如 何 将 它们 表示 成 32 位 的 二 进 制 
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图 9-25 不 恢复 除法 示例 


格式 。 在 本 章 中 ， 我 们 将 详细 描述 浮 点 数 的 表示 格式 以 及 对 浮 点 数 的 算术 运算 。 这 里 提供 的 这 
些 描述 是 基于 2008 版 本 的 IEEE ( Institute of Electrical and Electronics Engineers， 电 气 和 电子 工 


程 师 协 会 ) 754 标准 ， 标 记 为 754-2008[4]。 


回顾 一 下 第 1 章 中 曾 描 述 过 一 个 二 进 制 浮 点 数 可 以 表示 为 : 








e 数 的 符号 
。 一些 有 效 位 
e 有 符号 的 比例 因子 指数 ( 隐 含 的 基数 为 2 ) 
32 位 

je 余 127 格式 23 位 尾数 

0 表示 + 表示 的 8 位 的 小 数 部 分 

1 表示 - 有 符号 指数 

We E’-127 
表示 的 数值 = +1.M x2 
a ) 单 精度 


表示 的 数值 = 1.001010 … 0x2 


-87 


b ) 单 精 度数 示例 
图 9-26 IEEE 标准 浮 点 数 格 式 
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64 位 


Ot 


符号 EE tt 


11 位 余 1023 5 
格式 的 指数 的 小 数 部 分 
表示 的 数值 = +1.M x25 03 
c ) 双 精 度 
图 9-26 ( 续 ) 


基本 的 IEEE 格式 是 一 种 32 位 表示 ， 如 图 9-26a 所 示 。 最 左边 的 位 表示 数 的 符号 S$。 接 下 
来 的 8 位 E' 表 示 比 例 因 子 的 有 符号 指数 (有 一 个 隐 含 的 基数 2)， 剩 下 的 23 位 M 是 有 效 位 的 
小 数 部 分 。 有 效 位 的 整个 24 位 串 B 被 称 为 尾数 ( mantissa )， 其 前 导 位 始终 为 1， 并 有 一 个 二 
进 制 小 数 点 紧 靠 在 其 右边 。 因 此 ， 尾 数 

B= 1.M= 1.5.10 03 
的 值 为 
V(B)=1+b) x 2 +Da x 2 十 Da X 2 323 
习惯 上 ， 当 二 进 制 小 数 点 位 于 第 一 个 有 效 位 的 右 方 时 ， 我 们 说 这 个 数 是 规格 化 (normalized ) 
的 。 注 意 比例 因子 的 基数 2 以 及 尾数 的 前 导 位 1 都 是 固定 的 ， 它 们 不 需要 在 浮 点 数 的 表示 中 明 
确 地 出 现 。 

指数 域 中 存储 的 值 并 不 是 实际 的 有 符号 指数 EE， 而 是 一 个 无 符号 整数 E'= E+ 127。 这 被 
称 为 余 127 ( excess-127 ) 格式 。 这 样 ，E' 的 取 值 范围 为 0 志 E' 二 255。 这 个 范围 的 端点 值 0 
和 255 用 来 表示 特殊 值 ， 我 们 在 后 面 会 讲 到 。 因 此 E' 的 正常 取 值 范围 为 1 入 E' 254。 这 意 
味 着 实际 指数 E 的 取 值 范围 为 -126 三 E < 127。 指 数 使 用 余 127 表示 简化 了 两 个 浮 点 数 相 对 
大 小 的 比较 。( 参见 习题 9.23。) 

图 9-26a 中 的 32 位 标准 表示 称 为 单 精 度 ( single-precision ) 格式 ， 因 为 它 占用 了 一 个 32 
位 的 字 。 比 例 因 子 的 范围 为 2 到 2m"”， 这 大 致 接近 于 10:”。24 位 尾数 所 提供 的 精度 与 7 位 
十 进 制 值 相 仿 。 图 9-26b 中 显示 了 一 个 单 精 度 浮 点 数 的 例子 。 

为 了 提高 浮 点 数 的 精度 与 取 值 范围 ，IEEE 标准 还 指定 了 双 精 度 ( double-precision ) 格式 ， 
如 图 9-26c 所 示 。 双 精度 格式 增 大 了 指数 与 尾数 的 取 值 范围 。11 位 余 1023 指数 E' 的 正常 取 值 
范围 为 1 科 刀 入 2046，0 和 2047 用 来 指示 特殊 值 。 这 样 ， 实 际 指 数 五 的 取 值 范 围 为 -1022 么 
E 三 1023， 它 所 提供 的 比例 因子 为 2-202 到 22023 ( 接近 10*30 )。53 位 尾数 所 提供 的 精度 与 16 
位 十 进 制 数 字 相 当 。 

计算 机 必须 至 少 提供 单 精 度 表示 以 符合 IEEE 标准 。 双 精度 表示 是 可 选 的 。 标 准 还 规定 了 
这 两 种 表示 的 几 种 可 选 的 扩展 形式 。 这 些 扩 展 形式 为 计算 过 程 中 的 中 间 值 表示 提供 更 高 的 精度 
和 更 大 的 指数 范围 。 使 用 扩展 格式 有 助 于 减 小 计算 所 需 结 果 过 程 中 累积 的 舍 人 误差 。 例 如 ， 两 
个 向 量 的 点 积 可 以 通过 累加 乘积 的 和 得 到 。 输 入 向 量 分 量 以 标准 精度 表示 ， 即 单 精度 或 双 精 
度 ， 最 终 的 计算 结果 ( 点 积 ) 也 截取 为 同样 的 精度 。 所 有 的 中 间 计 算 都 应 该 使 用 扩展 的 精度 格 
式 进行 ， 以 减少 误差 的 累积 。 扩 展 格 式 还 可 以 提高 初等 函数 如 正弦 、 余 弦 等 的 精确 度 。 除 了 四 
种 基本 的 算术 运算 ， 标 准 还 要 求 提 供 余数 、 平 方 根 以 及 二 进 制 与 十 进 制 表示 的 转换 这 三 种 额外 
的 运算 。 

请 注意 浮 点 数 操作 的 两 个 基本 方面 。 第 一 ， 如 果 一 个 数 没 有 规格 化 ， 那 么 可 以 通过 
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移 位 二 进 制 小 数 点 和 调整 指数 将 它 转 化 为 规格 化 格式 。 图 9-27 显示 了 一 个 非 规格 化 的 数 
0.0010110… x 2?， 以 及 它 的 规格 化 形式 1.0110… x 25。 因 为 比例 因子 的 形式 为 2， 将 尾数 向 右 
或 向 左 移动 一 位 可 以 分 别 通 过 对 指数 加 1 或 减 1 来 补偿 。 第 二 ， 计 算 过 程 中 可 能 会 产生 正常 数 
字 表 示范 围 之 外 的 数字 。 对 于 单 精 度 ， 这 意味 着 该 数 的 规格 化 表示 中 的 指数 需要 小 于 -126 或 
者 大 于 +127。 在 第 一 种 情况 中 ， 我 们 说 发 生 了 下 溢 (underflow )， 而 在 第 二 种 情况 中 ， 我 们 说 
发 生 了 上 溢 (overflow )。 

余 127 格式 的 指数 

人 ~ 


oliooolooo 0010110… 


(二进制 小 数 点 左 方 没有 隐 含 的 1 ) 
表示 的 数值 = +0.0010110 … x22 
a ) 未 规格 化 的 值 


表示 的 数值 = +1.0110… x28 
b ) 规格 化 形式 
图 9-27 IEEE 单 精度 格式 浮 点 数 规格 化 


1， 特 殊 值 

余 127 指数 E' 的 端点 值 0 和 255 被 用 来 表示 特殊 值 。 当 E'= 0 且 尾 数 的 小 数 部 分 M 也 为 
0 时 ， 表 示 的 是 值 0。 当 已 = 255 且 M = 0 时 ,表示 的 是 值 w， 这 里 oo 是 用 0 去 除 一 个 正常 数 
的 结果 。 这 些 表示 中 仍然 使 用 符号 位 ， 所 以 存在 土 0 和 士 a 的 表示 。 

当 E'=0 且 M 关 0 时， 表示 的 是 非 规 格 化 ( denormal ) 数 ， 其 值 为 土 0.Mx 2 2。 因此 它 
们 比 最 小 的 规格 化 数 还 要 小 。 这 时 在 二 进 制 小 数 点 的 左 方 没有 隐 含 的 1， 而 M 是 任何 非 零 的 
23 位 小 数 。 引 入 非 规格 化 数 的 目的 是 实现 逐 级 下 溢 (gradual underflow )， 可 以 对 正常 表示 的 数 
值 范围 进行 扩展 ， 在 处 理 某 些 场合 下 所 需要 的 极 小 数值 时 非常 有 用 。 当 已 =255 且 M 关 0 时 ， 
表示 的 值 称 为 非 数 ( Not a Number，NaN )。NaN 表示 执行 非法 操作 的 结果 ， 例 如 0/0 或 -1。 

2， 异 常 

为 了 符合 IEEE 标准 ， 执 行 操作 时 如 果 发 生 以 下 条 件 ， 处 理 器 必须 设置 异常 (exception ) 
标志 : 下 溢 、 上 滋 、 除 0、 不 精确 和 非法 。 我 们 已 经 讲 过 前 三 种 条 件 。 不 精确 ( inexact ) 描 
述 的 是 结果 需要 进行 舍 人 才能 用 规范 格式 表示 的 情况 。 非 法 (invalid ) 异常 在 试图 执行 0/0 或 
V1 操作 时 发 生 。 当 一 个 异常 发 生 时 ， 计 算 结 果 就 被 设置 为 一 个 特殊 值 。 

如 果 人 允许 对 某 个 异常 标志 中 断 ， 当 相关 的 异常 发 生 时 就 会 进入 系统 或 用 户 定义 的 例 程 。 
或 者 ， 如 果 必 要 ， 应 用 程序 可 以 检测 异常 的 发 生 ， 并 决定 接 下 来 需要 做 什么 。 


9.7.1 浮 点 数 算术 运算 

本 节 我 们 将 概述 浮 点 数 的 加 、 减 、 乘 、 除 运算 的 基本 步 又。 下面 所 给 出 的 规则 适用 于 单 
精度 IEEE 标准 格式 。 这 些 规则 只 说 明了 执行 四 则 运算 的 主要 步骤 ; 例如 ， 我 们 没有 讨论 可 能 
发 生 的 上 溢 或 下 洲 。 还 有 ， 尾 数 与 指数 的 中 间 结 果 需 要 的 位 数 可 能 分 别 比 24 和 8 位 更 多 。 
在 设计 符合 标准 的 算术 部 件 时 ， 必 须 认 真 考虑 运算 中 的 这 些 问 题 及 其 他 问题 。 尽 管 在 规则 说 
明 中 没有 给 出 全 部 的 细节 ,我们 还 是 考虑 了 实现 中 的 一 些 方面 ， 包 括 后 面 章节 将 会 讨论 的 舍 
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人 问题 。 

当 对 浮 点 数 进行 加 或 减 运算 时 ， 如 果 它 们 的 指数 不 同 ， 则 尾数 必须 根据 对 方 进行 移 位 操 
作 。 考 虑 一 个 十 进 制 的 例子 ， 将 2.9400 x 10: 与 4.3100 x 104 相 加 。 我 们 将 2.9400 x 10? 重 写 为 
0.0294 x 104， 再 进行 尾数 加 法 从 而 得 到 4.3394 x 10' 。 加 减法 的 规则 如 下 : 

1， 加 /减法 规则 

1 ) 选取 指数 较 小 的 数 ， 将 其 尾数 右 移 ， 右 移 的 步 数 等 于 两 指数 之 差 。 

2 ) 将 结果 的 指数 设 为 与 较 大 的 指数 相等 。 

3 ) 对 尾数 进行 加 / 减 运 算 ， 并 确定 结果 的 符号 。 

4 ) 如 果 必 要 ， 对 结果 的 值 进行 规格 化 。 

乘除 法 比 加 减法 要 简单 些 ， 因 为 不 需要 对 齐 尾 数 。 

2， 乘 法 规则 

1 ) 将 指数 相 加 并 减 去 127 以 保持 余 127 表示 。 

2 ) 将 尾数 相 乘 并 确定 结果 的 符号 。 

3 ) 如 果 必 要 ， 对 结果 的 值 进行 规格 化 。 

3， 除 法 规则 

1 ) 将 指数 相 减 并 加 上 127 以 保持 余 127 表示 。 

2 ) 将 尾数 相 除 并 确定 结果 的 符号 。 

3 ) 如 果 必 要 ， 对 结果 的 值 进行 规格 化 。 


9.7.2 保护 位 与 截取 

现在 我 们 来 考虑 一 下 实现 上 述 算法 步骤 时 的 一 些 重要 方面 。 尽 管 初始 操作 数 和 最 终结 果 
的 尾数 都 限制 在 24 位 (包括 隐 含 的 前 导 1 )， 在 中 间 步 又 中 保留 一 些 附 加 位 ， 通 常 称 为 保护 
( guard ) 位 ， 是 非常 重要 的 。 它 们 使 最 终结 果 具 有 最 高 的 精确 度 。 

生成 最 终结 果 时 去 除 保护 位 要 求 对 扩展 的 尾数 进行 截取 (truncate )， 从 而 获得 接近 扩展 尾 
数 的 24 位 数 。 在 其 他 一 些 情 况 下 也 会 进行 这 一 操作 ， 比 如 将 十 进 制 数 转换 成 二 进 制 时 。 应 当 
指明 舍 人 也 可 以 用 于 截取 操作 ,但 是 在 这 里 我 们 将 舍 人 更 严格 地 定义 为 一 种 特定 格式 的 截取 。 

截取 有 几 种 方法 。 最 简单 的 方法 是 将 保护 位 去 除 ， 而 对 剩余 的 各 位 不 加 改变 。 这 种 方 
式 称 作 截 断 (chopping )。 假 设 我 们 要 使 用 这 种 方法 将 一 个 小 数 从 六 位 截取 到 三 位 。 区 间 
0.b-1b-2b-3 000 到 0.5-p_20.3 111 内 的 所 有 小 数 都 将 被 截取 为 0.5-15-2b-3。 三 位 结果 的 误差 为 0 到 
0.000111。 换 名 话说， 截断 误差 从 0 到 接近 剩余 位 最 低 有 效 位 置 上 的 1， 在 上 面 的 例子 中 ， 该 位 
置 就 是 bs 的 位 置 。 截 断 的 结果 是 有 偏 (biased ) 近似 ， 因 为 误差 区 间 并 不 关于 0 对 称 。 

另 一 种 最 简单 的 截取 方法 是 冯 。 诺 依 受 舍 入 (von Neumann rounding )。 如 果 要 去 除 的 各 位 
全 为 0， 就 简单 地 去 除 它 们 ， 并 保持 其 他 位 不 变 。 但 是 如 果 要 去 除 的 位 中 有 任何 一 位 为 1， 就 
将 剩余 位 的 最 低 有 效 位 置 为 1。 在 六 位 到 三 位 的 截取 例子 中 ， 所 有 b-sb-sb-6 不 等 于 000 的 小 数 
都 被 截取 为 0.5-15-21。 这 种 截取 方法 的 误差 在 剩余 位 LSB 位 置 的 -1 到 +1 之 间 。 尽 管 这 种 技 
术 的 误差 范围 比 截断 要 大 ， 但 误差 的 最 大 值 相 同 ， 而 且 其 近似 是 无 偏 (unbiased ) 的 ， 因 为 误 
差 区 间 关 于 0 对 称 。 

如 果 在 生成 结果 时 涉及 许多 操作 数 和 运算 ,那么 无 偏 近似 是 有 利 的， 因为 随 着 计算 的 进 
行 正 误差 会 与 负 误差 相 互 抵 消 。 在 统计 上 ， 复杂 计算 的 结果 更 精确 。 

第 三 种 截取 方法 是 含 入 (rounding ) 过 程 。 售 人 的 结果 最 接近 于 被 截取 的 数 ， 而 且 是 无 偏 
近似 。 其 过 程 如 下 : 如 果 去 除 位 的 MSB 位 置 上 为 1， 则 在 保留 位 的 LSB 位 置 上 加 1。 这 样 ， 


368 











369 








240 : 第 9 章 算术 运算 


0.b_1b_2b31… 就 被 舍 人 成 0.b_1b_2b_3 + 0.001， 而 0.b_1b-2b-30… 则 被 舍 入 为 0.5_15_2b_3。 这 种 方 
法 提供 了 我 们 需要 的 近似 ， 除 了 去 除 位 为 10…0 的 情况 。 这 是 一 个 中 间 状 态 ; 待 截取 的 数字 位 
于 两 个 最 近 的 截取 表示 的 正中 间 。 为 了 无 偏 地 解决 该 问题 ， 一 种 可 能 是 将 保留 位 设置 为 最 接近 
的 偶数 。 对 于 六 位 的 例子 ， 数 值 0.5_15_;0100 将 被 截取 为 0.5_15-20， 而 数值 0.5-15-21100 则 被 
截取 为 0.5_15_21 + 0.001-.“ 在 陷入 僵局 时 舍 人 到 最 近 的 数 或 最 近 的 偶数 ”这 句 话 有 时 就 是 用 来 
描述 这 种 截取 技术 。 误 差 区 间 大 致 在 保留 位 LSB 位 置 的 -1/2 到 +1/2。 很 明显 ， 这 是 最 好 的 方 
法 。 但 是 ， 它 也 是 最 难 实现 的 ， 因 为 它 要 求 一 次 加 法 操作 以 及 可 能 的 再 规格 化 。IEEE 浮 点 标 
准将 这 种 舍 入 技术 指定 为 截取 操作 的 默认 模式 。 标 准 还 规定 了 其 他 的 截取 方法 ,并 将 所 有 这 些 
方法 称 为 舍 和 模式。 

这 里 对 通过 截取 去 除 保护 位 引入 误差 的 讨论 只 考虑 了 单独 的 截取 操作 。 当 对 浮 点 数 进 
行 一 系列 很 长 的 计算 时 ,确定 最 终结 果 误 差 区 间或 范围 的 分 析 是 一 项 复杂 的 研究 。 除 了 对 
IEEE 浮 点 标准 中 保护 位 和 舍 入 的 处 理 方式 作 一 些 讨论 之 外 ， 我 们 将 不 再 进一步 讨论 数值 计 
算 等 方面 。 

根据 标准 ， 单 步 操作 的 结果 必须 精确 到 LSB 位 置 上 单位 的 一 半 。 这 意味 着 必须 采用 舍 入 
作为 截取 方法 。 实 现 舍 人 只 需要 在 执行 一 个 操作 的 中 间 步 又 中 添加 三 个 保护 位 。 其 中 前 两 位 是 
将 被 去 除 的 尾数 部 分 中 的 两 个 最 高 有 效 位 。 第 三 位 是 在 尾数 的 完整 表示 中 在 以 上 两 位 之 后 的 所 
有 低位 的 逻辑 或 。 这 一 位 在 所 执行 操作 的 中 间 步 又 中 比较 容易 维护 。 它 应 当初 始 化 为 0。 如 果 
在 对 齐 尾数 时 有 一 个 1 从 该 位 置 移出 ， 则 将 这 一 位 置 为 1， 并 保持 该 值 ; 因此 ， 它 通常 被 称 为 
粘着 位 (sticky bit )。 


9.7.3 浮 点 操作 的 实现 

浮 点 操作 的 硬件 实现 涉及 大 量 的 逻辑 电路 。 这 些 操作 也 可 以 用 软件 例 程 实现 。 不 论 使 用 
哪 种 方式 ， 计 算 机 必须 能 够 将 用 户 十 进 制 表示 的 数 转换 为 所 需要 的 输入 格式 ， 并 将 输出 转换 为 
十 进 制 表示 。 很 多 通用 处 理 器 在 机 器 指令 级 提供 浮 点 操作 ， 并 用 硬件 实现 。 

图 9-28 显示 了 一 个 浮 点 操作 实现 的 例子 。 这 是 具有 图 9-26a 所 示 格 式 的 32 位 浮 点 操作 数 
加 减 操作 的 硬件 实现 框图 。 按 照 9.7.1 节 中 的 加 /减法 规则 ， 我 们 看 到 第 1 步 是 比较 指数 以 确 
定 对 具有 较 小 指数 的 数 的 尾数 进行 移 位 的 次 数 。 移 位 次 数 n 由 图 中 左上 角 的 8 位 减法 器 电路 决 
定 。E-E' 的 差 值 n 被 传送 到 SHIFTER ( 移 位 器 ) 部 件 。 如 果 n 大 于 操作 数 的 有 效 位 数目 ， 
则 结果 实际 上 就 是 较 大 的 操作 数 ( 不 考虑 舍 入 中 的 保护 位 与 粘着 位 )， 而 且 可 以 采用 便捷 的 方 
法 产生 结果 。 对 此 我 们 不 进行 详细 讨论 。 

比较 指数 所 得 的 差 的 符号 决定 对 哪个 数 的 尾数 移 位 。 因 此 在 第 1 步 中 ， 这 个 符号 被 传人 
图 9-28 右上 角 的 SWAP ( 交换 器 ) 网 络 。 如 果 符 号 为 0， 则 E% 三 E683， 尾数 Mi 与 Ms 直接 通 
过 SWAP 网 络 。 这 使 得 Ms 被 送 入 SHIFTER， 并 被 右 移 n 位 。 男 一 个 尾数 M4 则 被 直接 送 入 尾 
数 加 法 器 /减法 器 。 如 果 符 号 为 1， 则 BE, 二 E's， 在 尾数 送 至 SHIFTER 之 前 需要 将 它们 交换 。 

第 2 步 由 图 中 靠近 左下 角 的 多 路 复 用 器 MUX 完成 。 结 果 的 指数 E' 暂时 由 第 1 步 中 指数 
比较 所 得 的 差 的 符号 确定 ， 如 果 E% 三 E% 则 E'=E%， 如 果 E% 二 Es 则 E'= E's。 

第 3 步 涉及 主要 的 组 件 一 一 图 中 部 的 尾数 加 法 器 /减法 器 。CONTROL ( 控制) 逻辑 尾 
数 是 相 加 还 是 相 减 。 这 由 操作 数 的 符号 (5 与 6s) 和 操作 数 上 执行 的 操作 ( 加 或 减 ) 确定 。 
CONTROL 逻辑 还 决定 结果 的 符号 St。 例 如， 如 果 4 为 负 (54 = 1)，B 为 正 (Ss=0)， 且 操作 
为 4-8， 则 需要 对 尾数 执行 加 法 且 结 果 的 符号 为 负 (Sa = 1 )。 另 一 方面 ， 如 果 4 和 B 都 为 正 ， 
且 操 作为 4-3， 则 需要 将 尾数 相 减 。 现 在 结果 的 符号 S 依赖 于 尾数 的 相 减 操作 。 例 如 ， 如 果 
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BE4>E2， 则 M=AM- ( 移 位 的 Ms )， 结 果 为 正 。 如 果 Eh < Es ， 则 M = Ms- ( 移 位 的 Ms)， 
结果 为 负 。 从 这 个 例子 可 以 看 出 ， 指 数 比 较 所 得 的 符号 也 需要 作为 CONTROL 网 络 的 输入 。 
当 E% = E' 且 尾数 相 减 时 ， 尾数 加 法 器 /减法 器 输出 的 符号 决定 了 结果 的 符号 。 读 者 现在 应 该 
可 以 为 CONTROL 网 络 构造 完整 的 真 值 表 了 (参见 习题 9.26 )。 







Al:S 已 ,AM1 
rf Sp } 
B:Sp,Ep,MBp 
Ea Eg 
Mi M 
E' 较 小 的 数 
的 尾数 M 









8 位 减法 器 
em 一 
! SHIFTER 
| 右 移 位 





组 合 控制 网 络 





前 导 0 检测 器 







规格 化 与 伟人 | 






8 位 减法 器 


E’-xX 





图 9-28 浮 点 加 法 /减法 部 件 


加 /减法 规则 的 第 4 步 是 通过 适当 地 左 移 或 右 移 M 来 对 第 3 步 的 结果 进行 规格 化 。M 中 
前 导 0 的 数目 决定 了 对 M 的 移 位 次 数 和 所 对 规格 化 的 值 伟人 从 而 生成 结果 的 24 位 尾数 Ma。 
临时 的 结果 指数 五 ' 也 需要 减 去 值 X， 生 成 真正 的 结果 指数 BEw。 注 意 ， 可 能 只 需要 右 移 一 位 
就 可 以 对 结果 规格 化 。 两 个 形式 为 1xx… 的 尾数 相 加 时 就 会 发 生 这 种 情况 。 这 时 M 向 量具 有 
1xxx… 的 形式 。 

对 于 中 间 尾 数值 必须 附带 的 保护 位 ， 我 们 没有 给 出 任何 细节 。 在 IEEE 标准 中 ， 如 前 所 
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述 ， 生 成 结果 中 的 24 位 规格 化 尾数 只 需要 几 个 保护 位 即 可 。 

让 我 们 考虑 一 下 实现 9-28 中 的 框图 所 需要 的 实际 硬件 。 如 前 所 述 ， 两 个 8 位 减法 器 和 尾 
数 加 法 器 /减法 器 可 以 使 用 组 合 逻 辑 实现 。 因 为 它们 必须 以 原 码 的 形式 输出 ， 因 此 我 们 需要 对 
前 面 的 讨论 做 一 些 修改 。 反 码 运算 与 原 码 表示 的 组 合 经 常用 到 。SHIFTER 和 输出 规格 化 操作 
的 实现 允许 有 极 大 的 灵活 性 。 这 些 操作 可 以 使 用 移 位 寄存 器 来 实现 。 然 而 ， 为 了 达到 高 性 能 ， 
也 可 以 将 它们 构造 为 组 合 逻 辑 部 件 。 


9.8 十进制 数 到 二 进 制 数 的 转换 

在 第 1 章 和 本 章 中 ， 涉 及 十 进 制 数 的 例子 都 使 用 了 932745]. 
比较 小 的 值 ， 根 据 二 进 制 位 位 置 的 权重 1，2，4，8，16 
等 将 十 进 制 数 转换 为 二 进 制 表示 是 非常 容易 的 。 但 是 ， 
如 果 有 一 种 将 十 进 制 数 转换 为 二 进 制 表示 的 通用 方法 ， 
将 会 是 很 有 用 的 。 | 

定点 的 无 符号 二 进 制 数 

B= bbn1**bo.b_1b bn 

有 位 整数 部 分 和 加 位 小 数 部 分 。 它 的 值 KB) 由 下 式 
给 出 : 








V(B)= b,x2"+br x2"! ++ box 2° 
+hbix2 +b yx2 ?++b nx2™ 

将 一 个 定点 的 十 进 制 数 转换 为 二 进 制 数 时 ， 整 数 部 
分 和 小 数 部 分 要 分 别 计算 。 整 数 部 分 的 转换 先 将 其 除 以 
2,， 余数 0 或 1 是 8 中 整数 部 分 的 最 低 有 效 位 h。。 商 再 
除 以 2， 余 数 是 B 中 整数 部 分 的 次 低位 b1/。 重 复 这 个 过 
程 直至 商 为 0 (包括 商 为 0 这 一 步 )。 

小 数 部 分 的 转换 先 将 其 乘 以 2。 乘积 中 十 进 制 小 数 
点 左边 的 部 分 0 或 1 是 8 中 小 数 部 分 的 位 5-1,。 乘 积 的 
小 数 部 分 再 乘 以 2， 得 到 B 中 小 数 部 分 的 下 一 位 5,。 重 
复 此 过 程 直 到 乘积 的 小 数 部 分 变 成 0 或 者 达到 要 求 的 精 
确 度 为 止 。 

图 9-29 给 出 了 一 个 将 十 进 制 数 927.45 转换 为 二 进 
制 的 例子 。 注 意 ， 整 数 部 分 的 转换 总 是 精确 的 ， 并 且 当 
商 为 0 的 时 候 结 束 。 但 一 个 给 定 的 十 进 制 小 数 可 能 不 
存在 精确 的 二 进 制 小 数 。 例 如 ， 图 9-29 中 的 十 进 制 小 
数 0.45 并 没有 精确 的 二 进 制 等 价值 。 这 从 图 中 可 以 明显 
地 看 出 来 。 在 这 种 情况 下 ， 二 进 制 小 数 按 所 需 的 精度 水 | ooxz> -040 | 
平 取 值 。 当 然 ， 有 些 十 进 制 小 数 有 精确 的 二 进 制 值 。 例 国生 全 全 
如 ， 十进制 小 数 0.25 有 等 价 的 二 进 制 值 0.01。 040x2 = 0:80 

0.80x2 = 0 外 -= 一。 1 LSB 





9.9 结束语 
计算 机 的 算术 运算 涉及 几 个 非常 有 趣 的 逻辑 设计 问 
题 。 本 章 讨 论 了 一 些 在 二 进 制 算 术 部 件 设计 中 有 实用 价 ”图 9-29 十 进 制 数 到 二 进 制 数 的 转换 


〈927.45)10 = (1110011111.0111001… 


)2 
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值 的 技术 。 超 前 进位 技术 是 高 性 能 加 法 器 设计 的 主要 思想 之 一 。 在 快速 乘法 器 的 设计 中 ， 由 
Booth 算法 发 展 而 来 的 乘 数 位 偶 重 编码 减少 了 生成 乘积 所 需 的 求 和 项 的 数目 。 使 用 进位 保留 简 
化 树 的 求 和 项 并 行 加 法 显著 地 减少 了 将 求 和 项 相 加 所 需 的 时 间 。 本 章 还 介绍 了 浮 点 数 的 IEEE 
表示 标准 ， 以 及 执行 浮 点 数 四 则 运算 的 规则 。 


9.10 ”问题 解析 

本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解 决 这 样 的 问题 。 
| 例 9.1 

问题 : 构建 图 9-4 所 示 的 4 位 超前 进位 加 法 器 需要 多 少 逻 辑 门 ? 

解答 : 如 图 9-4a 所 示 ， 每 个 B 单元 需要 3 个 门 ， 因 此 四 个 B 单元 需要 12 个 门 。 

根据 9.2.1 节 中 的 四 个 逻辑 表达 式 可 知 ， 超 前 进位 逻辑 产生 的 进位 c1/、c;、c3 和 cs 分 别 需要 2、3、4 
和 5 个 门 。 如 9.2.1 节 所 述 ， 超 前 进位 逻辑 还 使 用 4 个 门 产生 G6， 使 用 1 个 门 产生 Pu。 因 此 ， 实 现 超前 
进位 逻辑 总 共和 需要 19 个 门 。 

完整 的 4 位 加 法 器 需要 12+19=31 个 门 ， 且 最 大 的 扇 人 为 5。 
| 例 9.2| 

问题 : 假设 使 用 6 位 的 补 码 数 表示 ， 按 照 图 9-15 的 模式 ， 使 用 普通 的 Booth 算法 和 位 偶 重 编码 
Booth 算法 计算 被 乘 数 A=110101 与 乘 数 B=011011 的 乘积 。 

解答 : 乘法 的 执行 如 下 : 

(a ) 普通 的 Booth 算法 


1 1 0 1 0 1 
XxX +1 0 二 4 二 1 @ 二] 
0 0 0 0 0 0 0 1 0 1 1 
0 
1 1 1 1 1 1 0 1 0 1 
0 0 0 0 0 1 0 1 1 
0 
1 1 1 0 1 0 上 
1 1 1 0 1 1 0 1 0 1 1 1 
(b ) 位 偶 重 编码 Booth 算法 
1 1 0 1 0 1 
x 4# 汉 二 炎 一 站 
0 0 0 0 0 0 0 0 1 0 1 1 
0 0 0 0 0 0 1 0 1 1 
1 1 1 0 1 0 1 
1 1 1 0 1 1 0 1 0 1 1 1 
例 9,.3 
问题 : 在 简化 树 中 ， 要 将 个 求 和 项 降 为 2 个 需要 多 少 层 4-2 简化 器 ? 如 果 使 用 3-2 简化 器 ， 那 么 
将 需要 多 少 层 ? 
解答 : 假设 层 数 为 L。 
对 于 4-2 简化 器 ， 有 
k(1/2Y =2 
对 该 等 式 两 边 取 以 2 为 底 的 对 数 ， 可 以 得 到 
logzk—L=1 
或 者 
L=logxk—1 


对 于 3-2 简化 器 ， 有 
kK(2/3Y = 2 
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同上 ， 两 边 取 以 2 为 底 的 对 数 ， 得 到 
log2k + L(log22 — log23) = 1og22 
logzk+L(1 — 1.59)= 1 
L=(1 — logz 昌 /(-0.59) 
工 = 1.7log 一 1.7 
如 果 每 层 的 输入 求 和 项 数目 不 是 4 (4-2 简化 时 ) 或 者 3 (3-2 简化 时 ) 的 倍数 ， 那 么 这 些 表达 式 只 
能 是 近似 的 。 
问题 : 将 十 进 制 小 数 0.1 转换 为 二 进 制 小 数 。 如 果 转 换 不 精确 ， 使 用 9.7.2 节 中 讨论 的 三 种 截取 方法 
将 二 进 制 小 数 近 似 为 二 进 制 小 数 点 后 8 位 。 

375 解答 : 使 用 9.8 节 给 出 的 转换 方法 。 如 图 9-29 所 示 ， 将 十 进 制 小 数 0.1 乘 以 2， 所 得 乘积 的 小 数 部 
分 再 乘 以 2， 不 断 重复 这 一 过 程 ， 每 次 乘积 中 小 数 点 左边 的 部 分 生成 位 序列 0，0，0，1,，1,， 0，0，1，1， 
0，0，1，1，…， 该 序列 将 无 限期 地 继续 下 去 ， 重 复 模式 0，0，1，1。 因 此 ， 该 转换 是 不 精确 的 。 

e 通过 截断 方法 截取 得 到 0.00011001 

e 通过 冯 “。 诺 依 曼 舍 人 方法 截取 得 到 0.00011001 

e 通过 舍 入 方法 截取 得 到 0.00011010 
例 9.5 

问题 : 为 了 便于 完成 下 面 的 数字 练习 ， 考 虑 一 种 12 位 的 浮 点 数 表示 格式 。 第 1 位 是 数 的 符号 ， 接 下 
来 的 5 位 表示 比例 因子 ( 隐 含 的 基数 为 2 ) 的 余 15 格式 的 指数 。 最 后 6 位 表示 尾数 的 小 数 部 分 ， 其 二 进 
制 小 数 点 的 左边 有 一 个 隐 含 的 1。 

对 如 下 的 操作 数 4 和 8B 执行 减法 和 乘法 操作 : 





4 [Lo | oor [ovor] 
» Tm 
它们 分 别 表示 数 
4=1.011011 x 2? 
和 


B=—1.101010 x 2° 
解答 : 所 需 的 操作 执行 如 下 : 
e 减法 
根据 9.7.1 节 中 的 加 /减法 规则 ， 执 行 下 列 四 个 步骤 : 
1 ) 将 B 的 尾数 右 移 两 位 ， 得 到 0.01101010. 
2 ) 将 结果 的 指数 设 为 10001。 
3 ) 因为 B 为 负数 ， 所 以 通过 尾数 相 加 将 4 的 尾数 减 去 B 的 尾数 ， 得 到 


并 将 结果 的 符号 设 为 0 ( 正 )。 

4 ) 结果 是 规格 化 的 形式 ， 但 尾数 的 小 数 部 分 需要 被 截取 为 6 位 。 如 果 使 用 舍 人 方法 进行 截取 ， 要 
去 除 的 两 位 表示 中 间 状 态 ， 所 以 我 们 通过 加 1 将 保留 位 伟人 到 最 近 的 偶数 ， 得 到 结果 尾数 1.110110。 
结果 为 

4 Co [nongo] 

。 乘法 

根据 9.7.1 节 中 的 乘法 规则 ， 执 行 下 列 三 个 步 又 : 

1 ) 将 指数 相 加 并 减 去 15， 得 到 10001 作为 结果 的 指数 。 

2 ) 将 尾数 相 乘 ， 得 到 10.010110101110 作为 结果 的 尾数 ， 结 果 的 符号 设 为 1( 负 )。 
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3 ) 将 结果 尾数 右 移 一 位 对 其 进行 格式 化 ， 然 后 将 指数 加 1 得 到 10010 作为 结果 的 指数 。 通 过 舍 人 
方法 将 尾数 的 小 数 部 分 截取 为 6 位 ， 得 到 结果 


hz [0 rood ooor 


习题 

[M] 9.1 半 加 器 (half adder ) 是 一 个 组 合 罗 辑 电 路 ， 它 有 两 个 输入 xz 与 ?， 以 及 两 个 输出 与 <, 分 别 是 x 
与 y 相 加 所 得 的 和 与 进位 输出 。 
(a ) 采用 二 级 与 或 电路 设计 一 个 半 加 器 。 
(b ) 说 明 如 何 使 用 两 个 半 加 器 以 及 必要 的 外 部 逻辑 门 实现 图 9-2a 中 的 全 加 器 。 
(c) 比较 (b ) 部 分 的 网 络 和 图 9-2a 中 的 加 法 器 网 络 的 最 长 逻辑 延迟 路 径 。 

[M] 9.2 反 码 与 补 码 二 进 制 表示 方法 是 以 为 基数 的 数字 系统 中 (8-1 ) 进 制 补 码 和 4。 进 制 补 码 表示 技 术 
的 特例 。 例 如 ,考虑 十 进 制 系统 。 以 原 码 形式 表示 的 数值 f326、-526、+70 和 -70 在 两 个 补 码 
系统 中 都 有 4 位 原 码 表示 ， 如 图 P9-1 所 示 。 数 字 的 每 一 位 对 9 取 补 就 构成 了 九 进 制 补 码 。 对 九 
进 制 补 码 加 1 就 构成 了 十 进 制 补 码 。 在 这 两 种 表示 中 ， 正 数 的 最 左 位 为 0， 负数 的 最 左 位 为 9。 

示例 
+526 —526 +70 —70 


9 进 制 补 码 0526 9473 0070 9929 
10 进 制 补 码 0526 9474 0070 9930 





P9-1 习题 9.2 中 以 10 为 基数 的 有 符号 数 


现在 考虑 基数 为 3 的 系统 ( 三 进 制 系统 )， 其 中 5 位 无 符号 数 nu6abbm 的 值 为 4x3*+x33+ 
户 X3? + 四 X3 + 而 x30. 0 三 4 三 2。 将 原 码 表示 的 三 进 制 数 +11011、-10222、+2120、-1212、 
+10 和 -201 表示 为 三 进 制 补 码 系统 中 的 6 位 有 符号 三 进 制 数 。 

[M] 9.3 将 十 进 制 数 55、-37、122 和 -123 表示 为 三 进 制 补 码 格式 的 6 位 有 符号 数 ， 对 所 有 可 能 的 配对 
进行 加 减 操 作 ， 并 说 明 所 执行 的 每 个 操作 是 否 出 现 了 算术 溢出 。( 参见 习题 9.2 对 三 进 制 数 系统 
的 定义 ， 并 使 用 类 似 于 9.8 节 中 十 进 制 到 三 进 制 整数 转换 的 技术 。) 

[M] 9.4 对 BCD 数 求 和 需要 模 10 加 法 器 。 两 个 BCD 数 4 = 4;424140 和 B= BB281Bo 的 模 10 加 法 执行 
如 下 : 将 4 加 到 8B 上 (二进制 加 法 ) 之 后 ， 如 果 结 果 为 大 于 或 等 于 10u 的 非法 编码 ， 则 加 610。 
(忽略 本 次 加 法 的 溢出 。) 

(a) 什么 时 候 输 出 进位 等 于 1 ? 
(b ) 证 明 本 算法 对 于 以 下 数值 可 以 给 出 正确 结果 : 
(1)4=0101 B=0110 
(2)4=0011 B=0100 
(c) 使 用 4 位 二 进 制 加 法 器 以 及 必要 的 外 部 逻辑 门 设计 一 个 BCD 数 加 法 器 。 输 入 为 4;4,4140、 
B3B2B1Bo 与 进位 输入 。 输 出 为 和 数 53525156 与 进位 输出 。 级 联 这 样 的 组 件 可 以 构成 行 波 进位 
BCD 加 法 需 。 

[E] 9.5 使 用 适当 的 真 值 表 证 明 ， 在 补 码 整数 加 法 中 ， 逻 辑 表达 式 c 四 c- 正确 地 指示 了 溢出 的 发 生 。 

[E] 9.6 使 用 例 9.1 中 解决 方案 的 适当 部 分 计算 构建 图 9-5 中 的 16 位 超前 进位 加 法 器 需要 多 少 导 辑 门 。 

[M] 9.7 本 题 研究 的 是 超前 进位 加 法 器 及 其 延迟 问题 。 

(a) 使 用 四 个 图 9-5 所 示 的 16 位 超前 进位 加 法 器 以 及 附加 人 逻辑 电路 设计 一 个 64 位 加 法 器 ， 从 图 
中 的 co、 G 和 P/ 变量 生成 ci6。、c3;:、csgs 和 cos。 附 加 电路 与 图 中 超前 进位 逻辑 电路 有 什么 


关系 ? 
(b ) 证 明 9.2.1 节 末 尾 的 结论 ， 通 过 64 位 加 法 器 的 延迟 对 se 来 说 为 12 个 门 延 迟 ， 对 ca 来 说 为 
7 个 门 延迟 。 


(c) 比较 (a) 部 分 中 64 位 加 法 器 与 9.2.1 节 讨 论 的 使 用 两 个 16 位 加 法 器 级 联 构成 的 32 位 加 法 
器 生成 %; 和 ca 的 门 延 迟 。 





377 


378 





379 





246 : 第 9 章 算术 运算 


[M] 9.8 证 明 9.3.1 节 的 结论 ， 通 过 图 9-6b 中 的 nxn 阵列 最 坏 情 况 的 延迟 为 6(n-1) -1 个 门 延迟 。 
[E] 9.9 使 用 Booth 算法 计算 以 下 各 对 有 符号 补 码 数 的 乘法 。 假 设 4 为 被 乘 数 ， 为 乘 数 。 
(a)4=0101I1 B=110110 
(b)4=110011 B=101100 
(c)4=001111 38=001111 
[M] 9.10 使 用 乘 数位 偶 重 编码 重复 习题 9.9。 
[M] 9.11 概括 地 说 明 怎 样 修改 图 9-7a 中 的 电路 图 ， 使 其 可 以 使 用 Booth 算法 实现 位 补 码 数 的 乘法 。 明 
确 指 出 控制 序列 发 生 器 ( Control sequencer ) 的 输入 和 输出 ， 以 及 对 加 法 器 和 寄存 器 4 所 作 的 必 
要 改变 . 
[M] 9.12 将 图 9-14b 中 的 表 扩 展 为 16 行 ， 说 明 如 何 对 3 位 乘 数 位 寺 2、i+1l 和 i 重 编 码 。 是 否 可 以 通过 对 
被 乘 数 M 进行 移 位 和 /或 求 反 来 生成 位 置 i 选择 的 所 有 被 乘 数 变 体 ? 如 果 不 可 以 ， 那么 哪些 被 
乘 数 变 体 不 能 以 这 种 方式 生成 ?什么 情况 下 需要 这 些 被 乘 数 变 体 ? 
[M] 9.13 如 果 两 个 位 补 码 数 的 乘积 可 以 用 位 表示 ， 则 图 9-6a 中 的 手工 相 乘 算法 就 可 以 直接 使 用 ， 这 
时 将 符号 位 与 其 他 位 同等 对 待 。 用 这 种 方式 对 下 面 的 两 对 4 位 有 符号 数 进行 乘法 计算 : 
(a ) 被 乘 数 =1110 ” 乘 数 = 1101 
(b ) 被 乘 数 =0010 “ 乘 数 = 1110 
为 什么 这 时 的 计算 是 正确 的 ? 
[D] 9.14 利用 一 个 能 够 计算 16 位 无 符号 数 加 法 和 乘法 的 整数 运算 部 件 计算 两 个 32 位 无 符号 数 的 乘法 。 
所 有 的 操作 数 、 中 间 结 果 和 最 终结 果 存 储 于 标号 为 Ro 到 Ris 的 16 位 寄存 器 中 。 硬 件 乘法 器 将 
Ri (被 乘 数 ) 与 R ( 乘 数 ) 的 内 容 相 乘 ， 并 将 32 位 的 乘积 存 人 寄存 器 尼 和 玉 .， 中 ， 其 中 低位 
部 分 存 人 Rj 中。 当 j = 于 1 时 ， 乘 积 将 覆盖 两 个 操作 数 。 硬 件 加 法 器 将 玉 与 Rj 的 内 容 相 加 并 将 
结果 存 人 Rj 中 。 加 法 操作 的 进位 输入 为 0， 而 有 进位 加 法 ( Add-with-carry ) 操作 的 进位 输入 为 
进位 标志 C 的 内 容 。 加 法 器 的 进位 输出 始终 保存 在 C 中 。 
说 明 计算 寄存 器 RI、Ro。 和 R;、R, 中 两 个 32 位 操作 数 ( 高 位 部 分 在 前 ) 乘法 的 步骤 ,将 64 位 
的 乘积 放 人 寄存 器 Ris、Ri4*、R13 和 Ra 中 。 如 果 需 要 ，Ru 到 Rs 的 任何 寄存 器 都 可 以 用 来 保存 
中 间 结 果 。 过程 中 的 每 一 步 可 以 是 乘法 、 加 法 或 寄存 器 传输 操作 。 
[M] 9.15 本 题 研究 的 是 乘法 阵列 中 的 延迟 问题 。 
(a) 计算 图 9-16 中 每 个 4x4 乘法 阵列 产生 乘积 位 p, 的 延迟 ， 即 全 加 器 部 件 的 延迟 。 忽 略 开始 
时 生成 所 有 mg 乘积 的 与 门 延迟 。 
(b ) 作为 问题 (a ) 部 分 的 延伸 ， 为 图 9-16 中 的 每 个 阵列 写 出 其 在 nxn 情况 下 的 延迟 表达 式 。 
然后 使 用 这 些 表达 式 计算 每 个 矩阵 在 32 x 32 情况 下 的 延迟 。 
[M] 9.16 本 题 分 析 的 是 进位 保留 简化 中 的 树 深 问题 。 
(a ) 使 用 与 图 9-19 相似 的 模式 ， 将 16 个 求 和 项 降 为 两 个 需要 多 少 层 3-2 简化 操作 ? 
(b ) 将 32 个 求 和 项 降 为 两 个 ,重复 (a ) 部 分 的 问题 ， 以 证 明 9.5.3 节 中 八 层 的 结论 是 正确 的 。 
(c) 将 (a) 部 分 与 (b) 部 分 中 的 精确 答案 与 使 用 9.10 节 中 例 9.3 所 生成 的 近似 值 而 得 到 的 结 
果 进 行 比较 。 
[M] 9.17 9.5.3 节 和 9.5.4 节 分 别 描述 了 使 用 3-2 和 4-2 简化 器 对 求 和 项 进行 简化 的 树 结构 。 还 可 以 在 每 个 
简化 层 上 进行 7-3 简化 操作 。 当 只 剩 下 3 个 求 和 项 时 ， 执 行 3-2 简化 操作 ， 然 后 对 最 终 的 两 个 
求 和 项 执行 加 法 运算 。 
(a) 将 32 个 求 和 项 降 为 3 个 需要 多 少 层 7-3 简化 操作 ? 将 其 与 使 用 3-2 简化 时 将 32 个 求 和 项 
降 为 3 个 所 需要 的 7 层 进行 比较 - 
(b ) 9.10 节 中 例 9.3 证 明了 在 简化 树 中 将 人 个 求 和 项 降 为 2 个 需要 logx-1 层 4-2 简化 操作 ， 那 
么 将 k 个 求 和 项 降 为 3 个 需要 多 少 层 7-3 简化 操作 ? 
[M] 9.18 说 明 如 何 使 用 两 个 3-2 简化 器 实现 一 个 4-2 简化 器 ， 该 实现 的 真 值 表 与 图 9-21 中 的 不 同 。 
[M] 9.19 用 手工 方法 对 5 位 无 符号 数 4= 10101 和 B=00101 计 算 4xB 与 4:B 操作。 
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[M] 9.20 创建 与 图 9-7b 和 图 9-25 类 似 的 图 表 ， 说 明 习 题 9.19 中 的 乘法 和 除法 操作 是 如 何 使 用 图 9-7a 和 
图 9-23 的 硬件 执行 的 。 
[D] 9.21 在 9.7 节 中 ， 我 们 使 用 了 32 位 的 IEEE 标准 格式 来 表示 浮 点 数 。 这 里 使 用 一 种 缩短 格式 ， 它 保 
持 了 全 部 相关 的 概念 ， 但 是 便于 完成 数字 练习 。 考 虑 用 图 P9-2 中 的 12 位 格式 表示 浮 点 数 。 比 
例 因子 有 一 个 隐 含 的 基数 2 和 5 位 的 余 15 指数 ， 其 中 两 个 端点 值 0 和 31 分 别 用 来 表示 数值 0 
和 无 穷 大 。6 位 尾数 使 用 IEEE 格式 规格 化 ， 其 二 进 制 小 数 点 的 左边 有 一 个 隐 含 的 1。 
12 位 
一 一 一 一 一 一 | 
LE -= | 
3 
表示 数 的 符号 的 1 位 | 5 位 余 6 位 小 数 部 
0 表示 + 15 指数 分 的 尾数 
1 表示 - 
图 P9-2 习题 9.21 中 的 浮 点 数 格式 


(a ) 将 数字 +1.7、-0.012、+19 和 1/8 表示 为 这 种 格式 。 

(b ) 这 种 格式 所 能 表示 的 最 小 和 最 大 值 是 多 少 ? 

(c) 将 (b) 部 分 计算 的 区 间 范 围 与 12 位 有 符号 整数 和 12 位 有 符号 小 数 的 表示 范围 进行 比较 。 
(d) 对 如 下 的 操作 数 A 和 B 执行 加 减 乘除 运算 : 


人 [Ta Tan 
[To 


[D] 9.22 考虑 用 类 似 习 题 9.21 格式 表示 的 16 位 浮 点 数 ， 它 具有 6 位 指数 和 9 位 尾数 小 数 。 比 例 因子 的 
基数 为 2， 指数 采用 余 31 格式 表示 。 
(a) 将 以 下 格式 的 A 和 B 相 加 : 


2- [oun [oorororor | 
将 计算 结果 转换 为 规格 化 格式 。 记 住 二 进 制 小 数 点 的 左 方 有 一 个 隐 含 的 1 但 并 不 包含 在 4 
和 B 的 格式 中 。 在 生成 最 终 的 尾数 时 使 用 舍 入 法 作为 截取 方法 。 
(b ) 使 用 十 进 制 数 w、x、y 和 z 表示 前 面 规格 化 浮 点 数 格式 所 能 表示 的 最 大 值 与 最 小 ( 非 零 ) 值 。 
使 用 下 面 的 格式 
最 大 值 =w x2 
最 小 值 =yx2” 
[M] 9.23 在 图 9-26a 的 浮 点 数 表示 中 ， 指 数 的 余 x 表示 为 比较 两 个 浮 点 数 的 相对 大 小 提供 了 什么 便利 ? 
(提示 : 假设 有 一 个 组 合 逻 辑 网 络 可 以 比较 两 个 32 位 无 符号 整数 的 相对 大 小 。 使 用 这 一 网 络 以 
及 必要 的 外 部 逻辑 门 设计 比较 浮 点 数 所 需 的 网 络 。) 
[D] 9.24 在 习题 9.21 (a ) 中 ， 简 单 十 进 制 数 到 二 进 制 浮 点 数 的 转换 是 直接 的 。 但 是 ， 如 果 十 进 制 数 是 用 
浮 点 格式 表示 的 ， 转 换 就 不 是 直接 的 了 ， 这 是 因为 我 们 不 能 单独 地 转换 尾数 与 比例 因子 的 指数 ， 
因为 10 = 2 一 般 并 不 能 保证 x 和 yy 都 为 整数 。 假 设计 算 机 中 存储 着 一 个 表 ， 表 中 的 二 进 制 浮 
点 数 二 和 的 关系 为 t=10%。 请 说 明 将 给 定 的 十 进 制 浮 点 数 转 换 为 二 进 制 浮 点 格式 的 一 般 步 骤 。 
可 以 使 用 计算 机 中 的 整数 和 浮 点 数 指令 。 
[D] 9.25 构建 一 个 实例 ， 说 明 当 两 个 正 数 相 减 时 为 获得 正确 的 结果 需要 三 个 保护 位 。 
[M] 9.26 为 图 9-28 中 组 合 控制 网 络 的 输出 Add/Sub ( 加 / 减 ) 和 Sn 推导 逻辑 表达 式 。 
[M] 9.27 如 果 门 的 扇 和 人 为 4， 如 何 用 组 合 电路 实现 图 9-28 中 的 SHIFTER ( 移 位 器 ) ? 
[M] 9.28 画 出 实现 图 9-28 中 的 多 路 复 用 器 MUX 的 侵 辑 门 网 络 。 
[M] 9.29 将 图 9-28 中 的 SWAP ( 交换 器 ) 网 络 结构 与 习题 9.28 的 答案 联系 起 来 。 
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[M] 9.30 如 何 用 组 合 电 路 实现 图 9-28 中 的 前 导 0 检测 器 ? 

[M] 9.31 图 9-28 中 的 尾数 加 法 器 /减法 器 对 正 的 无 符号 二 进 制 小 数 操作 ， 而 且 必 须 以 原 码 的 形式 给 出 结 
果 。 在 对 图 9-28 的 讨论 中 我 们 说 过 对 于 输入 和 输出 操作 数 所 需 的 格式 ， 反 码 运 算是 非常 方便 
的 。 当 两 个 反 码 表示 的 有 符号 数 相 加 时 ， 必 须 将 符号 位 的 进位 输出 加 到 结果 中 才能 得 到 正确 答 
案 。 这 被 称 为 循环 进位 校正 (end-around carry correction )。 图 P9-3 中 的 两 个 示例 使 用 4 位 有 符 
号 反 码 对 操作 数 和 答案 编码 ， 并 展示 了 加 法 操作 。 当 需要 生成 原 码 形式 的 结果 时 ， 反 码 运算 系 
统 是 非常 方便 的 ， 因 为 以 反 人 码 形式 表示 的 负数 可 以 通过 对 符号 位 右 方 的 各 位 求 补 转换 为 原 码 形 
式 。 而 使 用 补 码 运算 ， 将 负数 转换 为 原 码 形式 时 需要 加 上 +1。 如 果 使 用 超前 进位 加 法 器 ， 可 以 
将 反 码 运算 所 需 的 循环 进位 操作 结合 到 超前 逻辑 当中 。 请 以 上 述 讨 论 为 指导 ， 给 出 图 9-28 中 反 
码 加 法 器 /减法 器 的 完整 设计 。 





图 P9-3 “习题 9.31 中 的 反 码 加 法 


[M] 9.32 1.4.2 节 中 讨论 了 补 码 表示 的 有 符号 二 进 制 小 数 。 
(a) 将 十 进 制 数值 0.5，-0.123，-0.75 和 -0.1 表示 为 6 位 有 符号 的 小 数 。( 参阅 9.8 节 中 的 十 
进 制 到 二 进 制 小 数 的 转换 。) 
(b ) 当 二 进 制 小 数 点 后 使 用 5 位 有 效 数 字 时 ， 最 大 表示 误差 e 是 多 少 ? 
(c ) 分 别 计算 表示 误差 e 小 于 0.1、0.01 或 者 0.001 时 二 进 制 小 数 点 后 所 需 的 有 效 数 字 位 数 。 
[E] 9.33 习题 9.32 (a) 中 的 四 个 6 位 答案 哪些 是 不 精确 的 ?对 每 一 个 不 精确 的 答案 ,给 出 与 9.7.2 节 定 
义 的 三 种 截取 方法 相对 应 的 三 个 6 位 值 。 
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众人 式 系统 





本 章 目 标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 和 伐 和 人 式 应 用 

e 做 人 式 系统 中 的 微 控制 器 

e 传感器 与 执行 器 

。 使 用 C 语言 控制 IO 设备 

e 设计 问题 

前 几 章 我 们 讨论 了 通用 计算 机 系统 中 使 用 的 一 些 概念 ， 现 在 我 们 将 集中 讨论 旨 在 为 特定 
的 应 用 提供 服务 的 系统 。 用 于 对 特定 目标 进行 计算 机 控制 而 不 是 用 于 通用 计算 的 实际 系统 ， 称 
为 说 入 式 系统 ( embedded system )。 我 们 将 展示 如 何在 这 样 的 系统 中 应 用 前 面 介绍 的 一 般 概念 。 

为 租 入 式 系统 编写 的 软件 的 一 个 重要 方面 是 它 必须 与 硬件 紧密 交互 。 术 语 反 应 系统 
( reactive system ) 通常 用 来 描述 这 样 的 情况 : 执行 各 种 例 程 的 时 间 点 是 由 处 理 器 外 部 的 事件 确 
定 的 ， 比 如 一 个 开关 的 闭合 ， 或 者 在 一 个 输入 端口 上 到 达 了 新 的 数据 。 软 件 设 计 人 员 必 须 决定 
如 何 实现 这 种 交互 。 第 3 章 中 介绍 的 基于 轮 询 和 中 断 的 输入 /输出 技术 将 用 于 此 目的 。 

微 处 理 器 控制 现在 普遍 应 用 于 照相 机 、 手 机 、 可 视 电话 、 销 售 点 终端 、 厨 房 电器 、 汽 车 
和 许多 玩具 中 。 在 这 些 应 用 中 ， 低 成 本 和 高 可 靠 性 是 基本 的 要 求 ， 小 尺寸 和 低 功 耗 往往 也 是 至 
关 重 要 的 。 为 实现 所 有 的 这 些 要 求 ， 通 常 我 们 不 仅仅 将 处 理 器 电路 ， 还 将 一 些 存储 器 、 输 入 / 
输出 接口 、 定 时 器 电路 和 其 他 功能 放置 到 一 个 单一 的 芯片 上 ， 以 便于 使 用 很 少 的 芯片 来 实现 一 
个 完整 的 计算 机 控制 系统 。 这 种 类 型 的 微 处 理 器 芯片 通常 被 称 为 微 控制 器 ( microcontroller )。 
在 这 一 章 中 ， 我 们 将 探讨 基于 微 控 制 右 的 垦 入 式 系统 的 主要 特点 。 在 第 11 章 中 ， 我 们 将 讨论 
使 用 现场 可 编程 门 阵列 ( FPGA ) 技术 来 实现 这 种 系统 的 片上 系统 方法 。 


10.1 嵌入 式 系 统 实例 


在 本 节 中 我 们 给 出 三 个 垦 入 式 系 统 的 实例 ， 说 明 在 一 个 典型 的 舱 入 式 应 用 中 所 需要 的 处 
理 过 程 和 控制 功能 。 


10.1.1 微波 炉 


许多 家 用 电器 使 用 计算 机 控制 去 管理 它们 的 操作 ， 典 型 的 例子 就 是 微波 炉 。 这 种 用 有 具 基 
于 一 个 磁 控 管 发 生 器 产生 的 微波 去 加 热 在 一 个 封闭 空间 中 的 食物 。 当 磁 控 管 打开 时 ， 它 产生 最 
大 的 功率 输出 ， 较 低 的 功率 级 别 是 通过 依据 受 控 的 时 间 间 隔 开 关 磁 控 管 的 方式 达到 的 。 有 了 控 
制 功 率 和 总 加 热 时 间 的 功能 ， 就 可 以 应 对 亮 调 操作 中 各 种 用 户 的 选择 。 

微波 炉 的 具体 规格 说 明 可 能 包括 以 下 的 豪 调 操作 : 

e 手动 选择 功率 级 别 和 毫 调 时 间 。 

。 手动 选择 不 同 毫 调 步骤 的 次 序 。 

。 在 用 户 指明 了 食物 类 型 ( 例如 : 肉 、 蔬 菜 或 爆 米花 ) 以 及 食物 的 重量 时 自动 操作 ; 然后 ， 

一 个 合适 的 功率 和 时 间 便 由 控制 器 计算 出 来 。 
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e 根据 指定 食物 重量 自动 解冻 。 

炉 中 包含 一 个 显示 器 ， 它 可 以 显示 : 

e 每 日 时 钟 定时 

e 烹饪 过 程 中 时 钟 定时 器 递减 

e 给 用 户 的 提示 信息 

以 蜂 鸣 声 形式 发 出 的 声音 报警 信号 ， 用 于 表示 京 饪 操作 结束 。 还 需要 提供 一 个 排 风 扁 和 
一 个 炉 灯 信号 。 作 为 一 种 安全 措施 ， 如 果 炉 子 的 门 被 打开 ， 门 锁 必须 关闭 磁 控 管 。 所 有 这 些 功 
能 可 以 用 微 控制 器 控制 。 

与 用 户 有 关 的 输入 /输出 功能 必须 包括 : 

e 输入 键 ， 它 包括 0 一 9 的 数字 键 以 及 Reset ( 重 置 )、Start ( 开启 )、Stop ( 暂停 )、 

Power Level ( 功率 级 别 )、Auto Defrost ( 自动 解冻 )、Auto Cooking ( 自动 烹饪 )、Clock 
Set ( 时 钟 设置 ) 及 Fan Control ( 风扇 控制 ) 这 样 的 功能 键 。 

e 液晶 显示 器 形式 的 可 视 化 输出 ， 类 似 于 图 3-17 所 示 的 七 段 显示 器 。 

e 一 个 小 型 扬声器 用 来 产生 蜂 鸣 声 。 

由 微 控制 器 执行 的 用 来 控制 微波 炉 的 计算 任务 非常 简单 ， 仅 包括 维护 每 天 的 时 钟 时 间 、 
确定 各 种 豪 饪 操作 中 所 需 的 动作 、 产 生 打开 或 关闭 磁 控 管 和 电 风 扇 这 类 设备 的 控制 信号 以 及 生 
成 显示 信息 。 实 现 所 需 动作 的 程序 非常 小 ， 它 存储 在 一 个 不 易 失 的 只 读 存储 器 中 ， 这 样 当 关闭 
电源 时 才 不 会 丢失 。 还 需要 有 一 个 小 型 的 RAM 用 于 在 运算 过 程 中 执行 和 保存 用 户 的 输入 数 
据 。 微 控制 器 中 最 重要 的 需求 就 是 ， 针 对 所 有 的 输入 键 、 显 示 器 和 输出 控制 信号 ， 微 控制 器 
要 具备 足够 的 IO 能 力 。 并 行 VO 端口 提供 了 一 套 与 外 部 的 输入 和 输出 信号 进行 交互 的 便利 
方法 。 

图 10-1 给 出 了 微波 炉 的 一 种 可 能 的 组 成 结构 。 一 个 带 有 小 容量 ROM 和 RAM 部 件 的 简单 
处 理 器 就 足够 用 了 。 一 些 基 本 的 输入 /输出 接口 用 来 连接 该 系统 的 其 他 部 分 。 在 一 个 小 的 微 控 
制 器 芯片 中 实现 这 些 电路 中 的 大 部 分 功能 是 可 行 的 。 

















扬声器 
图 10-1 一 个 微波 炉 的 框图 
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10.1.2 ”数码 照相 机 

数码 照相 机 给 出 了 一 个 在 小 型 封装 设备 中 成 熟 的 戏 和 人 式 系 统 的 优秀 范例 。 图 10-2 列 出 了 
数码 照相 机 中 的 主要 部 分 。 

传统 照相 机 使 用 胶片 去 捕获 图 像 。 在 数码 照相 机 中 ， 用 一 个 光 传 感 器 阵列 去 捕获 图 形 。 
这 些 传 感 器 可 以 将 光 转 换 成 电荷 。 光 的 强度 决定 产生 电荷 总 量 的 大 小 。 商 业 产 品 中 使 用 了 两 种 
不 同类 型 的 传感器 。 一 种 类 型 是 著名 的 电荷 辜 合 器 件 ( charge-coupled device，CCD )。 最 早 的 
数字 照相 机 中 就 是 用 的 这 种 传 感 设备 。 它 渐渐 被 改进 成 可 提供 高 质量 图 像 的 设备 。 最 近 基 于 
CMOS 技术 的 传感器 已 经 开发 出 来 。 

每 个 传感器 产生 一 个 对 应 于 一 个 像素 ( pixel ) 的 电荷 ， 它 是 图 片 图 像 中 的 一 个 点 。 像 
素 的 数量 决定 了 可 以 记录 和 显示 的 图 片 的 质量 。 电 荷 是 一 个 模拟 量 ， 它 被 数 模 (analog-to- 
digital，A/D ) 转换 电路 转换 成 数字 表示 方式 。A/D 转换 可 以 产生 一 个 图 像 的 数字 表示 形式 ， 其 
中 每 个 像素 的 颜色 和 亮度 使 用 若干 个 位 来 表示 。 然 后 ， 图 像 的 这 种 数字 形式 就 可 以 像 使 用 标准 
计算 机 电路 处 理 的 任何 其 他 数据 那样 进行 操作 了 - 

图 10-2 中 的 处 理 器 和 系统 控制 器 模块 包含 着 需要 与 系统 其 他 部 分 连接 的 接口 电路 。 处 理 
器 控制 照相 机 的 操作 ， 它 对 从 A/D 电路 中 接收 的 原始 图 像 数 据 进 行 处 理 ， 生 成 用 标准 格式 表 
示 的 图 像 ， 这 些 标准 格式 适合 用 于 计算 机 、 打 印 机 和 显示 设备 。 主 要 使 用 的 格式 有 : 用 于 无 压 
缩 图 像 的 TIFF ( 标签 图 像 文件 格式 )， 和 用 于 压缩 图 像 的 JPEG ( 联合 图 像 专家 组 )。 处 理 过 的 
图 像 存储 在 一 个 大 型 图 像 存储 设备 中 ， 在 8.3.5 节 中 描述 的 闪存 卡 (Flash memory card ) 就 是 
一 种 用 于 图 像 存 储 的 流行 设备 。 





连接 到 PC 的 电缆 
图 10-2 一 个 简化 的 数码 照相 机 框图 


获取 并 处 理 过 的 图 像 可 以 在 区 入 在 照相 机 中 的 液晶 显示 器 (LCD ) 的 屏幕 上 进行 显示 。 
这 允许 用 户 决定 哪个 图 像 值 得 保存 。 可 以 保存 的 图 像 的 数量 与 图 像 存 储 器 的 大 小 有 关 ， 同 时 也 
依赖 于 所 选择 的 图 像 质量 ， 即 每 个 图 像 中 像素 的 个 数 以 及 压缩 程度 (JPEG 格式 )。 

标准 接口 提供 将 图 像 传递 到 计算 机 或 打印 机 中 的 机 制 。 这 通常 由 一 根 USB 线 来 完成 。 如 
果 使 用 了 闪存 卡 ， 图 像 也 可 以 通过 物理 地 传递 内 存 卡 的 形式 进行 传递 。 

系统 控制 器 还 生成 控制 调 焦 装置 和 闪光 部 件 操 作 所 需要 的 信号 。 有 一 些 输入 信息 是 由 于 
用 户 对 开关 的 操作 而 形成 的 。 


387 
1 
388 


252 : 第 10 章 获 入 式 系统 


数码 照相 机 中 所 需要 的 处 理 器 比 之 前 描述 的 微波 炉 应 用 中 的 处 理 器 要 强大 许多 ， 该 处 理 
器 必须 执行 复杂 的 信号 处 理 功 能 。 而 且 ， 重 要 的 是 该 处 坦 器 不 能 消耗 太 多 的 能 量 ， 因 为 照相 机 
是 一 种 用 电池 做 电源 的 设备 。 通 常 处 理 器 消耗 的 电能 比照 相机 中 显示 器 和 闪光 灯 所 消耗 的 电能 
要 少 。 


10.1.3 ”家 用 遥测 技术 


微 控制 器 被 用 在 家 庭 中 大 量 的 散人 和 人 式 应 用 中 。 在 10.1.1 节 中 我 们 考虑 了 微波 炉 的 例子 ， 
在 其 他 的 设备 中 还 可 以 找到 类 似 的 例子 ， 像 洗衣 机 、 干 燥 机 、 洗 碗 机 、 炊 具 、 火 炉 以 及 空调 。 
另 一 个 值得 关注 的 例子 是 可 视 电 话 ， 在 电话 中 嵌入 处 理 器 使 得 电话 可 以 具有 多 种 有 用 的 特征 。 
除了 标准 的 电话 特征 外 ， 带 有 艇 人 式微 控制 器 的 电话 可 以 对 家 庭 中 的 其 他 设备 进行 远程 访问 。 

使 用 这 种 电话 可 以 远程 执行 以 下 功能 : 

。 与 一 个 计算 机 控制 的 家 庭 安 全 系统 通信 。 

e 对 火炉 或 空调 保持 的 温度 进行 调整 ， 设 定 一 个 合适 的 温度 。 

e 对 提前 已 放 入 微波 炉 中 的 食品 设 定 启动 时 间 、 京 调 时 间 及 加 热 温度 。 

。 读 电 表 、 气 表 和 水 表 ， 取 代 过 去 服务 公司 派 遗 雇员 到 家 中 去 读 这 些 表 的 过 程 。 

如 果 每 一 个 这 种 类 型 的 设备 都 是 由 微 控 制 器 控制 的 ， 那么 所 有 这 些 功 能 都 很 容易 实现 。 
因为 只 需要 在 设备 中 的 微 控制 器 与 电话 中 的 微 处 理 器 之 间 提 供 一 条 有 线 的 或 无 线 的 连接 即 可 。 
用 远 距 离 的 信号 去 观察 并 控制 设备 的 状态 通常 称 为 适 测 技术 〈telemetry )。 


10.2 ”和 财 入 式 应 用 中 的 微 控制 器 芯片 


一 个 微 控 制 器 芯片 应 该 是 通用 的 ， 以 便于 能 够 为 各 种 各 样 的 应 用 提供 服务 。 图 10-3 给 出 
了 一 个 典型 芯片 的 模块 图 。 其 中 主要 的 部 分 是 处 理 器 核 ( processor core )， 它 是 商用 微 处 理 器 
的 基础 版 本 。 选 择 在 实际 中 已 经 证 明 被 广泛 接受 的 微 处 理 器 体系 结构 是 较 稳 妥 的 ， 因 为 针对 这 
样 的 处 理 器 已 经 有 许多 CAD 工具 、 优 秀 的 实例 以 及 大 量 有 助 于 新 产品 设计 的 经 验 和 知识 。 






并 行 VO 端口 


串 行 VO 端口 













内 部 存储 器 


计数 器 /定时 器 


图 10-3” 微 控制 器 框图 


在 芯片 中 包含 一 些 存 储 器 是 非常 有 用 的 ， 你 会 发 现 这 些 存储 器 完全 能 够 满足 小 型 应 用 中 
的 存储 要 求 。 这 些 存储 器 中 有 些 必须 是 RAM 类 型 的 ， 用 于 存储 那些 在 计算 中 发 生变 化 的 数 
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据 ;， 有 些 应 该 是 只 读 类 型 的 ， 用 来 存储 软件 ， 因 为 戏 入 式 系统 中 通常 不 包括 磁盘 。 为 了 满足 低 
容量 应 用 中 的 成 本 效益 ， 需 要 有 一 种 现场 可 编程 类 型 的 ROM 存储器， 而 实现 这 种 存储 的 流行 
选择 是 EEPROM 和 闪存 。 

有 几 种 VO 端口 可 以 同时 提供 并 行 和 串 行 的 接口 ， 这 些 接口 可 以 容易 地 实现 标准 的 IO 连 
接 。 在 许多 的 应 用 中 ， 需 要 以 可 编程 的 时 间 间 隔 生 成 控制 信号 。 如 果 微 控制 器 芯片 中 包含 一 个 
定时 器 电路 ， 这 类 任务 就 很 容易 完成 。 因 为 定时 器 是 一 个 时 钟 脉冲 计数 电路 ， 所 以 它 也 可 以 用 
作 事 件 计 数 ， 比 如 对 一 个 移动 的 机 械 臂 或 旋转 轴 所 产生 的 脉冲 个 数 进 行 计数 。 

在 一 个 嵌入 式 系统 中 可 能 包含 一 些 模拟 设备 ， 为 了 能 与 这 样 的 设备 进行 交互 ， 就 需要 能 
够 将 模拟 信和 号 转换 成 数字 表示 形式 ， 反 之 亦 然 。 如 果 骨 入 式 控 制 器 中 包含 有 A/D 和 D/A 转换 
电路 ， 这 些 也 是 很 容易 做 到 的 。 

许多 赃 入 式 处 理 器 芯片 在 市 面 上 可 以 得 到 ， 一 些 比较 好 的 芯片 有 : Freescale 的 68HC11 及 
68K/ColdFire 系列 ，Intel 的 8051 和 MCS-96 系列 ， 它 们 都 有 CISC 风格 的 处 理 器 核 ， 而 ARM 
微 控 制 器 具有 RISC 风格 的 处 理 器 。 处 理 器 核 的 特性 在 本 章 不 是 重要 的 讨论 内 容 ， 我 们 强调 的 
是 嵌入 式 应 用 系统 方面 的 内 容 ， 并 说 明 如 何 将 前 几 童 介绍 的 概念 结合 起 来 用 到 一 个 完整 的 媒人 入 
式 计算 机 系统 的 设计 中 去 。 


10.3 ”一 个 简单 的 微 控 制 器 

微 控 制 器 的 输入 /输出 结构 必须 有 足够 的 灵活 性 ， 以 满足 不 同 应 用 的 需求 ， 并 能 充分 利用 
芯片 上 的 管 脚 。 例 如 ， 一 个 并 行 端口 既 可 以 配置 为 输入 也 可 以 配置 为 输出 。 

在 这 一 节 中 我 们 讨论 一 个 简单 微 控制 器 的 基本 结构 ， 说 明 它 的 一 些 典型 特征 。 图 10-4 给 
出 了 它 的 框图 ， 其 中 包含 一 个 处 理 器 核 和 一 些 片上 存储 器 。 因 为 片上 存储 器 可 能 满足 不 了 所 有 
潜在 的 应 用 ， 因 此 在 该 芯片 的 管 脚 上 提供 了 处 理 器 的 总 线 连接 ， 以 便 可 以 添加 外 部 存储 器 。 

它 有 两 个 8 位 的 并 行 接口 ( 称 为 端口 A 和 端口 B ) 以 及 一 个 串 行 接口 。 该 微 控制 器 还 包 
含 一 个 32 位 的 计数 器 /定时 器 电路 ， 该 电路 可 以 用 来 在 设 定 的 时 间 间 隔 内 产生 内 部 中 断 ， 还 
可 以 用 来 作为 系统 的 定时 器 、 对 输入 线 上 的 脉冲 个 数 计数 、 生 成 方 波 输出 信号 等 。 


10.3.1 并 行 MO 接口 

骨 和 人 式 系统 的 应 用 在 输入 /输出 接口 方面 需要 相当 大 的 灵活 性 。 所 涉及 的 设备 的 性 质 ， 以 
及 它们 如 何 连 接 到 微 控 制 器 上 ， 可 以 通过 考虑 图 10-1 所 示 的 微波 炉 中 的 一 些 组 件 来 理解 。 当 
门 打开 时 ， 需 要 一 个 传感器 来 产生 一 个 值 为 1 的 信和 号， 这 个 信号 被 发 送 到 微 控制 器 输入 接口 的 
一 个 引 脚 上 。 微 波 炉 前 面板 的 按键 也 是 如 此 。 这 些 简 单 的 设备 每 一 个 产生 一 位 信息 。 

输出 设备 也 可 以 用 类 似 的 方式 来 控制 。 磁 控 管 是 由 能 将 它 打开 或 关闭 的 单一 输出 线 来 控 
制 的 。 风 扇 和 灯 也 是 如 此 。 扬 声 器 也 可 以 通过 单一 的 输出 线 连接 ， 处 理 器 在 该 输出 线 上 发 送 一 
个 具有 适当 音调 频率 的 方 波 信号 。 另 一 方面 ， 液 晶 显 示 器 需要 并 行 发 送 多 个 数据 位 。 

微 控制 器 输入 /输出 接口 的 设计 目标 之 一 是 尽 可 能 地 减少 对 外 部 电路 的 需要 。 微 控制 器 可 
能 被 连接 到 简单 的 设备 上 ， 其 中 许多 设备 只 需要 一 根 输入 或 输出 信号 线 。 在 大 多 数 情况 下 ， 不 
需要 编码 或 解码 。 

图 10-4 中 每 个 并 行 端口 都 有 一 个 相关 联 的 8 位 数据 定向 寄存 器 ， 可 用 于 将 独立 的 数据 线 
配置 为 输入 或 输出 。 图 10-5 说 明了 对 端口 A 上 的 某 一 位 的 双向 控制 。 如 果 数 据 定向 触发 器 中 
的 值 为 0， 端 口 引 脚 PA; 就 被 当 作 一 个 输入 。 在 这 种 情况 下 ， 对 控制 信号 Read_Port 的 激活 操 
作 会 将 逻辑 值 放 在 处 理 器 总 线 中 数据 线 Di; 的 端口 引 脚 上 。 如 果 数 据 定向 触发 器 的 值 被 设置 为 
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1， 端 口 引 脚 作 为 输出 使 用 。 在 Write_Port 信号 的 控制 下 ， 加 载 到 输出 数据 触发 器 中 的 值 被 放 
置 在 引 脚 上 。 





内 部 存储 器 


图 10-4 “一 个 微 控 制 器 的 例子 


图 10-5 只 显示 了 控制 数据 传输 方向 的 接 口 Read_Port 
部 分 ， 在 输入 数据 的 路 径 上 ， 没 有 触发 器 捕获 并 
保存 由 连接 到 相应 引 脚 上 的 设备 所 提供 的 数据 信 D; 
号 的 值 。 一 个 通用 的 并 行 接口 可 能 包括 两 种 可 能 
性 : 一 种 是 直接 从 引 脚 读 取 输 入 数据 ， 另 一 种 则 
是 将 输入 数据 存储 在 图 7-11 所 示 接 口 的 寄存 器 

392 ”中 ， 可 通过 在 接口 的 控制 寄存 器 中 设置 一 位 来 先 
393| ” 择 这 两 种 方式 中 的 一 种 。 Wite port 

图 10-6 描述 了 并 行 接口 中 的 所 有 寄存 器 ， 
以 及 分 配给 它们 的 地 址 。 这 里 我 们 任意 选择 了 32 
位 地 址 范围 中 的 高 端 地 址 。 

状态 寄存 器 PSTAT 包含 着 状态 标志 。 当 端 ” Write_DIR 
口 A 上 有 新 数据 时 ，PASIN 标志 被 置 成 1。 当 处 
理 器 通过 读 取 PAIN 寄存 器 接收 了 该 数据 时 ， 它 数据 定向 
又 被 清 为 0。 当 寄存 器 PASOUT 中 的 数据 被 所 连 图 10-5 访问 图 10-4 的 端口 A 中 的 一 位 
接 的 设备 接收 时 ，PASOUT 标志 被 置 成 1， 表示 人 处理 右 现在 可 以 向 PAOUT 中 装 人 新 数据 了 。 
接口 使 用 一 根 单独 的 控制 线 (将 在 下 文 描述 ) 来 向 所 连接 的 设备 发 送 新 数据 可 用 的 信号 。 当 处 
理 器 将 数据 写 人 PAOUT 时 ，PASOUT 标志 被 清 为 0。PBSIN 和 PBSOUT 标志 对 端口 B 执行 同 
样 的 功能 。 

状态 寄存 器 还 包含 了 四 个 中 断 标志 。 当 某 个 中 断 被 允许 并 且 相 应 的 LO 动作 发 生 时 ， 就 
有 一 个 中 断 标志 ( 比如 IAIN ) 被 设置 成 1。 中 断 允 许 位 保存 在 控制 寄存 器 的 PCONT 中 。 
PCONT 中 的 某 个 允许 位 被 设置 成 1 就 可 以 允许 相应 的 中 断 发 生 。 例 如 ， 如 果 ENAIN=1 并 且 
PASIN=1， 则 中 断 标 志 IAIN 被 置 成 1 并 且 产 生 一 个 中 断 请 求 。 因 此 ， 

IAIN = ENAIN.PASIN 

一 个 单独 的 中 断 请 求 信 号 用 于 接口 中 所 有 的 端口 。 作 为 对 某 个 中 断 请 求 的 响应 ， 处 理 器 必须 检 
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查 中 断 标 志 以 确定 该 中 断 请 求 的 实际 来 源 。 


地 址 
FFFFFFFO PAIN 端口 A 输入 
FFFFFFF2 PADIR 端口 A 方向 
FFFFFFF3 PBIN 端口 B 输 入 
FFFFFFFS PBDIR 端口 B 方 向 
7 者 村 刺 可 交工 7 
FFFFFFF6 状态 寄存 器 (PSTAT) 
IBOUT PASIN 
IBIN PASOUT 
IAOUT PBSIN 
IAIN PBSOUT 
mm TT TT [| sow ecow 
ENBOUT ENAIN PAREG 
ENBIN ENAOUT PBREG 


图 10-6 并 行 接口 寄存 器 

状态 和 控制 寄存 器 中 的 信息 用 于 控制 向 或 从 连接 到 端口 A 和 端口 B 上 的 设备 传递 数据 。 
端口 A 有 两 条 控制 线 CAIN 和 CAOUT,， 它们 可 以 在 接口 和 所 连接 的 设备 间 提 供 自动 的 信和 号 机 
制 。 对 于 输入 传递 ,设备 将 新 数据 放置 在 端口 引 脚 ， 并 通过 激活 CAIN 一 个 时 钟 周期 来 表示 该 
动作 。 当 接口 电路 观测 到 CAIN=1 时 ， 它 将 状态 位 PASIN 置 成 1。 稍 后 ， 当 处 理 器 读 出 了 这 个 
输入 数据 时 该 位 被 清 为 0。 这 个 动作 还 引发 该 接口 向 CAOUT 连 线 发 送 一 个 脉冲 ， 通 知 该 设备 
可 以 向 接口 发 送 新 的 数据 了 。 对 于 输出 传递 ， 处 理 器 将 数据 写 人 PAOUT 寄存 器 中 ， 接 口 对 其 
作出 响应 ， 将 PASOUT 位 清 为 0 并 向 CAOUT 连 线 发 送 一 个 脉冲 以 通知 设备 可 以 得 到 新 的 数 
据 了 。 当 设备 接收 该 数据 时 ， 会 向 CAIN 连 线 发 送 一 个 脉冲 ， 这 又 将 PASOUT 置 成 1。 当 一 个 
端口 上 的 所 有 数据 引 脚 有 着 同样 的 方向 时 ， 也 就 是 当 端 口 都 作为 输入 或 输出 时 ， 才 可 使 用 这 种 
信和 号 机 制 。 如 果 选 择 一 些 引 脚 作为 输入 而 其 他 的 作为 输出 ， 就 不 能 使 用 自动 机 制 了 ， 控 制 线 以 
及 状态 和 控制 寄存 器 中 也 均 不 包含 有 用 的 信息 。 在 这 种 情况 下 ， 输 入 数据 直接 从 引 脚 读 取 。 

控制 寄存 器 的 PAREG 和 PBREG 位 分 别 用 来 选择 端口 A 和 B 的 输入 操作 模式 。 如 果 两 者 
都 置 为 1， 就 用 寄存 器 来 存储 输入 数据 ; 否则 ， 就 要 像 图 10-5 所 示 的 那样 使 用 引 脚 连 出 来 的 直 
接 通 路 。 作 为 一 个 使 用 直接 通路 的 例子 ， 考 虑 图 10-1 所 描述 的 微波 炉 的 操作 。 微 控制 器 将 磁 
控 管 打开 ， 开 始 豪 饪 操作 ， 但 是 只 有 当 炉 门 关上 时 它 才 可 以 这 样 做 。 一 个 简单 的 传感器 开关 通 
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过 提供 一 个 信号 来 指示 炉 门 是 否 是 打开 的 ， 该 信号 可 以 被 读 取 为 一 个 比特 的 数据 。 传 感 器 连接 
到 微 控制 器 接口 的 一 个 引 脚 上 ， 使 微 控制 器 可 以 直接 读 取 这 个 输入 的 逻辑 值 ， 从 而 确定 炉 门 的 
状态 。 


10.3.2 ”上 串 行 VO 接口 

串 行 接口 基于 7.4.2 节 中 描述 的 方案 提供 了 UART (Universal Asynchronous Receiver/ 
Transmitter， 通 用 异步 收发 器 ) 功能 来 传递 数据 。 在 发 送 与 接收 路 径 中 都 使 用 了 双 缓 冲 ， 如 
图 10-7 所 示 。 这 种 缓冲 用 来 正确 处 理 IO 传递 中 的 突 发 数据 流 。 

图 10-8 给 出 串 行 接口 的 可 编 址 寄存 器 ， 
输入 数据 被 从 8 位 的 接收 缓冲 区 中 读 出 ， 输 
出 数据 被 装 和 人 8 位 的 传送 缓冲 区 中 。 状 态 寄 
存 器 SSTAT 提供 有 关 接 收 和 传送 单元 的 当前 
状态 信息 。 当 在 接收 缓冲 区 中 存在 有 效 的 数 
据 时 ，SSTAT。 位 被 置 成 1， 当 对 接收 缓冲 区 
进行 读 访 问 时 ， 它 被 自动 清 为 0。 当 传送 组 
冲 区 为 空 并 可 以 装 入 新 数据 时 ，SSTAT, 位 被 
置 成 1。 这 些 位 与 在 3.1 节 中 讨论 的 状态 标 
志 KIN 和 DOUT 起 着 相同 的 作用 。 如 果 在 
接收 过 程 中 产生 了 一 个 错误 ，SSTAT; 就 被 管 
成 1。 例 如， 如 果 接 收 缓冲 区 中 的 字符 在 被 
处 理 器 读 出 之 前 被 后 面 接收 的 字符 覆盖 ， 就 
产生 一 个 错误 。 状 态 寄存 器 中 还 包含 有 中 断 
标志 ， 当 接收 缓冲 区 已 满 并 且 接 收 区 中 断 是 
允许 的 ，SSTAT; 位 被 置 成 1。 类似 地 ， 当 传 
送 缓 冲 区 变 为 空 并 且 传 送 区 中 断 是 允许 的 ， 图 10-7 串 行 接口 中 的 接收 和 传送 结构 
SSTAT; 位 被 置 成 1。 如 果 SSTAT 或 是 SSTAT; 等 于 1， 串 行 接口 就 引发 一 个 中 断 。 当 SSTAT, =1 
并 且 错 误 条 件 中 断 是 允许 时 的 ，SSTAT 被 置 成 1， 此 时 串 行 接口 也 引发 一 个 中 断 。 

控制 寄存 器 SCONT 用 来 保存 中 断 允 许 位 。 设 定 SCONTe4 位 为 1 或 0， 分 别 表示 人 允许 或 
禁止 相应 的 中 断 发 生 。 该 寄存 器 中 还 说 明 如 何 生成 传送 时 钟 ， 如 果 SCONT。 = 0， 则 传送 的 时 
钟 与 系统 ( 处 理 器 ) 时 钟 相同 ; 如果 SCONTo =1， 则 用 时 钟 除法 电路 获得 低频 率 的 传送 时 钟 。 

串 行 接口 中 的 最 后 一 个 寄存 器 是 时 钟 除数 寄存 器 DIV。 这 个 32 位 的 寄存 器 与 一 个 计数 器 
电路 相关 联 ， 该 计数 器 电路 对 系统 时 钟 信号 进行 分 频 生成 串 行 传送 时 钟 ， 生 成 的 时 钟 信号 的 频 
率 等 于 系统 时 钟 频 率 除 以 该 寄存 器 的 内 容 所 得 到 的 频率 。 装 人 该 寄存 器 的 值 被 传递 到 计数 器 中 ， 
然后 用 系统 时 钟 进行 递减 计数 。 当 计数 减 为 零 时 ， 该 计数 器 将 DIV 寄存 器 中 的 值 重新 装 入 。 


10.3.3 ”计数 器 /定时 器 


32 位 的 递减 计数 器 电路 可 以 作为 计数 器 或 定时 器 使 用 。 该 电路 的 基本 操作 包括 将 一 个 起 
始 值 加 载 到 计数 器 中 ， 然 后 使 用 内 部 系统 时 钟 或 是 外 部 时 钟 信号 递减 计数 器 中 的 内 容 。 这 个 电 
路 可 被 编程 为 当 计数 器 中 的 内 容 达 到 0 时 引发 一 个 中 断 。 图 10-9 给 出 了 与 计数 器 /定时 器 电 
路 相关 联 的 寄存 器 。 计 数 器 /定时 器 的 寄存 器 CNTM 可 以 被 装 入 一 个 初 值 ， 然 后 将 它 传递 到 
计数 器 电路 中 。 计 数 器 中 的 当前 内 容 可 以 通过 访问 内 存 地 址 FFFFFFD4 来 读 出 。 控 制 寄存 器 
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CTCON 用 于 指明 计数 器 / 定时 器 电路 的 操作 方式 。 它 提供 了 一 种 机 制 用 于 开始 和 停止 计数 过 
程 以 及 当 计数 器 内 容 递减 为 0 时 允许 中 断 。 状 态 寄 存 器 CTSTAT 反映 该 电路 的 状态 。 
地 址 


区 6 5 4 3 2 1 0 
1 : 错误 中 断 1 : 接收 区 满 
1 : 传送 区 中 断 1 : 传送 区 空 
1 : 接收 区 中 断 1 : 发 现 错误 
1 :允许 错误 中 断 0 :使 用 系统 时 钟 
1 :人 允许 传送 区 中 断 1 : 分 频 时 钟 
1 :允许 接收 区 中 断 
31 0 


FFFFFFE4 DIV ( 除数 寄存 器 ) 


图 10-8 ” 串 行 接口 寄存 器 
地 址 31 0 


FFFFFFDO CNTM (初始 值 ) 
FFFFFFD4 COUNT ( 计数 器 内 容 ) 


7 6 5 4 3 2 1 0 


0 : 计数 器 1 : 开始 
1 : 定时 器 1 : 停止 
1 : 允许 中 断 


1 : 计数 器 达到 0 
图 10-9 计数 器 /定时 器 寄存 器 


1， 计 数 器 模式 

设 定 CTCON; 位 为 0 时 选择 该 电路 为 计数 器 模式 ， 将 起 始 值 写 人 寄存 器 CNTM 来 将 其 装 
入 计数 器 中 。 当 CTCON 位 被 程序 指令 设置 成 1 时 计数 过 程 开始 。 一 旦 计数 开始 ，CTCON。 
位 自动 清 为 0。 计 数 器 随 图 10-4 中 计数 器 输入 ( Counter in ) 线 上 的 脉冲 递减 。 当 达到 0 时 ， 


[399 
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计数 器 电路 将 状态 标志 CTSTAT。 置 成 1， 如 果 此 时 相应 的 中 断 人 允许 位 已 经 被 置 成 1， 就 引发 一 
个 中 断 。 在 下 一 个 时 钟 脉冲 到 来 时 计数 器 重新 装 和 信保 存在 寄存 器 CNTM 中 的 起 始 值 ， 然 后 计 
数 过 程 继续 。 当 CTCON 位 被 设置 为 1 时 计数 过 程 停止 。 

2， 定 时 器 模式 

设 定 CTCON; 位 为 1 时 选择 该 电路 为 定时 器 模式 ， 这 种 模式 可 用 于 产生 周期 性 的 中 断 ， 
也 适合 于 在 图 10-4 中 的 输出 线 Timer_out 上 生成 一 个 方 波 信和 号。 这 个 过 程 的 开始 如 同上 面 对 计 
数 器 模式 的 解释 一 样 ， 当 计数 器 进行 递减 计数 时 ， 输 出 线 上 的 值 保 持 不 变 。 当 减 到 0 时， 计数 
器 自动 用 起 始 值 进行 重新 加 载 ， 这 时 连 线 上 的 输出 信号 反 向 。 因 此 ， 输 出 信号 的 周期 是 起 始 计 
数值 与 控制 时 钟 脉冲 周期 乘积 的 两 倍 。 在 定时 器 模式 下 ， 计 数 器 用 系统 时 钟 作 递减 操作 。 


10.3.4 ”中断 控 制 机 制 


在 微 控制 器 例子 中 的 处 理 器 有 两 个 中 断 请 求 输入 IRQ 和 XRQ。IRQ 输入 用 于 由 微 控 制 器 
内 部 IO 接口 引发 的 中 断 ; XRQ 输入 用 于 由 外 部 设备 引发 的 中 断 。 如 果 IRQ 输入 有 效 ， 并 且 
中 断 是 被 允许 的 ， 则 处 理 器 执行 一 个 中 断 服务 程序 ， 它 用 轮 询 方式 确定 中 断 请 求 源 。 通 过 检 
查 状态 寄存 器 PSTAT 、SSTAT 及 CTSTAT 中 的 标志 位 来 完成 这 个 过 程 。XRQ 中 断 的 优先 级 比 
IRQ 中 断 的 优先 级 高 。 

处 理 器 中 的 状态 寄存 器 PSR 有 两 个 中 断 允 许 位 。 如 果 PSRe=1， 则 IRQ 中 断 被 允许 ; 如果 
PSR; =1， 则 XRQ 中 断 被 允许 。 当 处 理 器 接收 一 个 中 断 时 ， 它 将 在 中 断 服务 程序 执行 前 清除 
相应 的 PSR 位， 禁止 同一 优先 级 上 的 其 他 中 断 产 生 。 这 里 要 用 到 向 量 中 断 方法 ， 其 中 对 应 于 
IRQ 和 XRQ 中 断 的 向 量 分 别 存 放 在 存储 单元 0x24 和 0x28 中 。 每 个 向 量 中 包含 着 相应 的 中 断 
服务 程序 的 第 一 条 指令 的 地 址 。 这 个 地 址 会 自动 装 和 人 程序 计数 器 PC 中 。 

在 处 理 器 中 有 一 个 链接 寄存 器 LR， 它 如 同 在 2.7 节 中 讲述 的 那样 ， 用 于 子 程序 的 链接 。 
一 条 子 程序 调用 指令 将 使 程序 计数 器 中 修改 后 的 内 容 ( 即 需要 的 返回 地 址 ) 在 转移 到 子 程序 的 
第 一 条 指令 前 被 保存 到 LR 中 。 还 有 一 个 寄存 器 IRA， 它 在 接收 中 断 请 求 时 保存 返回 地 址 。 这 
时 ， 除 了 将 返回 地 址 保存 在 IRA 中 以 外 ， 处 理 器 状态 寄存 器 PSR 中 的 内 容 还 应 保存 在 处 理 器 
的 寄存 器 IPSR 中 。 

从 子 程序 返回 是 通过 执行 一 条 ReturnS 指令 完成 的 ， 该 指令 将 LR 中 的 内 容 传递 到 PC 中 。 
从 中 断 中 返回 是 通过 执行 ReturnI 指令 完成 的 ， 该 指令 将 IRA 和 IPSR 中 的 内 容 分 别传 递 到 PC 
和 PSR 中 。 因 为 只 有 一 个 IRA 和 IPSR 寄存 器 ， 构 套 式 中 断 可 以 通过 在 中 断 服务 程序 中 使 用 
指令 ， 将 这 些 寄 存 器 中 的 内 容 保 存在 堆栈 中 的 方法 来 实现 。 注 意 ， 如 果 中 断 服务 程序 调用 一 个 
子 程序 ， 那 么 中 断 服 务 程序 必须 保存 LR 的 内 容 ， 因 为 中 断 可 能 会 发 生 在 处 理 器 执行 另 一 个 子 
程序 的 时 候 。 


10.3.5 ”编程 实例 

前 面 已 经 介绍 了 微 控 制 器 的 硬件 ， 现 在 我 们 来 考虑 当 微 控制 器 的 接口 连接 到 1/O 设备 时 所 
引起 的 一 些 软 件 问 题 。 程 序 可 以 用 汇编 语言 或 高 级 语言 来 编写 ， 后 一 种 选择 在 大 部 分 应 用 中 更 
可 取 ， 因 为 这 样 所 需要 的 编码 更 容易 生成 和 维护 ， 而 且 开 发 时 间 较 短 。 在 本 章 的 例子 中 ,我们 
将 使 用 C 编程 语言 。 

本 节 中 的 例子 是 一 些 最 基本 的 应 用 ， 旨 在 说 明 实 现 方法 的 可 能 性 。 在 10.4 节 中 ， 我们 将 
给 出 一 个 完整 且 比 较 复杂 的 应 用 程序 实例 。 
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例 10.1 

考虑 以 下 任务 ， 使 用 微 控制 器 监测 一 些 机 械 设 备 的 状态 。 这 些 状 态 信 息 由 四 根 电 线 上 提 
供 的 二 进 制 信号 获得 。 该 状态 的 16 个 可 能 值 将 在 图 3-17 所 示 的 七 段 显 示 器 上 显示 为 一 个 16 
进 制 数字 。 

使 用 图 10-4 到 10-6 所 示 的 并 行 接口 可 以 实现 所 需要 的 操作 ，4 根 输入 线 连接 到 端口 A 的 
引 脚 上 ，7 根 数据 线 连接 到 端口 B 的 七 段 显 示 器 上 。 然 后 ， 数 据 定 向 寄存 器 PADIR 和 PBDIR 
必须 将 端口 A 和 B 分 别 配 置 为 输入 和 输出 ， 输 入 数据 就 可 从 端口 A 的 引 脚 上 直接 读 出 。 

图 10-10 给 出 了 一 个 可 能 的 程序 。Define 语句 用 来 将 需要 的 地 址 常量 与 指针 的 符号 名 关联 
起 来 。 注 意 , PAIN 指针 被 声明 为 可 变 的 (volatile )。 这 样 做 是 因为 程序 只 能 读 相应 地 址 的 内 容 ， 
而 不 能 向 这 个 地 址 写 任 何 数 据 ， 也 不 能 将 这 个 地 址 与 一 个 特定 的 值 相 关联 。 一 个 优化 的 编译 器 
可 能 会 删除 那些 看 起 来 没有 影响 的 程序 语句 ， 这 些 语 句 中 包含 一 些 变量 ， 但 它们 的 值 从 未 被 改 
变 过 。 因 为 寄存 器 PAIN 的 内 容 改变 是 受 程 序 外 部 因素 影响 的 ， 所 以 有 必要 将 这 个 事实 告诉 编 
译 器 。 编 译 器 不 会 删除 那些 包含 可 变 变 量 的 语句 。 

这 定义 寄存 器 地 址 */ 
PAIN (volatile unsigned char *) OxFFFFFFFO 
PADIR (volatile unsigned char *) OxFFFFFFF2 
PBOUT (volatile unsigned char *) OxFFFFFFF4 


PBDIR (volatile unsigned char *) OxFFFFFFFS 
PCONT (volatile unsigned char *) OxFFFFFFF7 


人 # 十 六 进 制 到 七 段 的 转换 表 */ 

unsigned char table[16] = { 0x40, 0x79, Ox24, Ox30, Ox19, Ox12, 
Ox02. Ox78, Ox00, Ox18, Ox08, 0x03, Ox46, Ox21, Ox06, OxOE }; 

unsigned int current_value; 


void main() 


诺 初始化 端口 A 和 B */ 

*PADIR = 0x0; 让 将 端口 A 配置 为 输入 端口 */ 
*PBDIR = OxFF:; /将 端口 B 配置 为 输出 端口 */ 
*PCONT = Ox0; /#* 直接 从 引 脚 读 取 输 入 #/ 


证 读 取 并 显示 数据 */ 
while (1) 连续 循环 */ 
{ 


current_value = *PAIN & OxOF: /* 从 端口 A 读 取 输 入 */ 

*PBOUT = table[current_value]; /* 将 字符 发 送 到 端口 B*/ 
} 

} 





图 10-10 例 10.1 的 C 程序 


将 一 个 十 六 进 制 数字 转换 成 相应 的 七 段 模式 时 要 使 用 一 个 表 。 本 程序 使 用 了 一 个 连续 的 
循环 去 读 取 和 显示 新 的 数据 。 但 在 实际 的 应 用 中 ， 不 可 能 以 这 种 方式 使 用 循环 ， 因 为 系统 中 还 
可 能 包含 其 他 的 任务 。 我 们 此 处 使 用 连续 的 循环 仅仅 是 为 了 使 例子 简单 化 。 

现在 考虑 一 个 能 以 位 串 格 式 发 送信 息 的 IO 设备 的 情况 ， 这 种 位 串 格 式 的 信息 可 以 由 
图 10-7 和 图 10-8 中 所 描述 的 串 行 接口 处 理 。 该 设备 发 送 8 位 的 信息 ， 将 在 两 个 图 3-17 那样 的 
七 段 显示 器 上 显示 为 两 个 十 六 进 制 数字 。 我 们 将 该 TO 设备 连接 到 串 行 接口 上 ， 七 段 显示 器 连 
接 到 并 行 端口 A 和 B 上。 内 此 ，A 和 B 都 必须 被 配置 为 输出 端口 。 
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图 10-11 给 出 了 一 个 可 能 的 程序 。 使 用 轮 询 法 来 确定 串 行 接口 的 接收 缓冲 区 中 的 新 数据 什 
入 时 候 可 用 。SSTAT, 位 作为 轮 询 的 标志 位 ， 如 10.3.2 节 中 所 描述 的 ， 当 从 缓冲 区 中 读 取 数 据 
时 这 个 位 被 清 零 。 


六 定义 寄存 器 地 址 */ 
#define RBUF (volatile unsigned char *) OxFFFFFFEO 
#define SSTAT (volatile unsigned char *) OxFFFFFFE2 
#define PAOUT (volatile unsigned char *) OxFFFFFFF!1 
#define PADIR (volatile unsigned char *) OxFFFFFFF2 
#define PBOUT (volatile unsigned char *) OxFFFFFFF4 
#define PBDIR (volatile unsigned char *) OxFFFFFFFS 


/# 十 六 进 制 到 七 段 的 转换 表 */ 

unsigned char table[16] = {0x40, 0x79, 0x24, Ox30, Ox19, Ox12, 
Ox02, Ox78, Ox00, Ox18, Ox08, Ox03, Ox46, 0x21, Ox06, O0xOE }; 

unsigned int current_value, low_digit, high_digit; 


void main() 

{ 
此 初始 化 并 行 端口 */ 
*PADIR = 0xFF; 尺 将 端口 A 配置 为 输出 端口 要 
*PBDIR = OxFF:; /# 将 端口 B 配置 为 输出 端口 */ 


上 # 读 取 并 显示 数据 */ 

while (1) 庆 连 续 循 环 */ 

{ 
while ((*SSTAT & 0x1) == 0); 此 等 待 新 数据 */ 
current_value = *RBUF:; 片 读 取 8 位 的 值 */ 
low_digit = current_value & OxOF.; 
high_digit = (current_value > > 4) & 0xOF; 
*PAOUT = table[low_digit]; 睛 将 两 个 数字 发 送 */ 
*PBOUT = table[high_digit]; /* 到 七 段 显 示 器 上 */ 








图 10-11 例 10.2 的 C 程序 ， 使 用 轮 询 方式 读 取 输 入 数据 


图 10-12 显示 了 用 中 断 的 方式 访问 新 数据 的 程序 。 回 顾 10.3.4 节 ，IRQ 中 断 向 量 在 存储 单 
元 0x20 中 ， 中 断 服务 程序 的 地 址 被 装 和 人 这 个 单元 。 将 SCONT 位 置 为 1 以 允许 接收 区 中 断 。 
为 了 使 处 理 器 响应 IRQ 中 断 ， 处 理 器 状态 寄存 器 PSR 的 第 6 位 必须 被 置 为 1。 因 为 PSR 不 是 
可 寻 址 空间 中 的 一 个 单元 ， 所 以 需要 使 用 asm 指示 符 将 下 列 汇编 语言 指令 众人 到 C 程序 中 : 

MoveControl PSR, #0x40 
此 外 ， 需 要 在 目标 程序 中 包含 中 断 返 回 指令 ， 以 保证 能 够 正确 返回 到 被 中 断 的 程序 。 编 译 器 将 
插入 这 条 指令 ， 因 为 inserv 函数 的 定义 中 包含 中 断 〈interrupt ) 这 个 关键 词 。 在 高 级 语言 中 处 
理 中 断 的 方式 在 4.6 节 中 作 了 介绍 。 
#define (volatile unsigned char *) OxFFFFFFEO 


#define (volatile unsigned char *) OxFFFFFFE3 
#define (volatile unsigned char *) OxFFFFFFF!1 


#define (volatile unsigned char *) OxFFFFFFF2 
#define (volatile unsigned char *) OxXFFFFFFF4 
#define (volatile unsigned char *) OxFFFFFFFS 
#define (volatile unsigned int *) Ox20 





图 10-12 例 10.2 的 C 程序 ， 使 用 中 断 方式 读 取 输 入 数据 
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/#* 十 六 进 制 到 七 段 的 转换 表 */ 

unsigned char table[16] = {0x40, Ox79, Ox24, Ox30, Ox19, Ox12, 
Ox02, Ox78, Ox00, Ox18, Ox08, Ox03, Ox46, 0x21, Ox06, OxOE}; 

unsigned int current_value, low_digit, high_digit; 


interrupt void intserv(); 


void main() 

{ 
广 初 始 化 并 行 端口 */ 
*PADIR = OxFF:; /# 将 端口 A 配置 为 输出 端口 */ 
*PBDIR = OxFF; 放 将 端口 B 配置 为 输出 端口 */ 


/# 初始 化 中 断 机 制 */ 

*IVECT = (unsigned int *) &intserv; 赃 设 置 中 断 向 量 */ 
asm ("MoveControl PSR, #0x40"); 庆 响 应 IRQ 中 汤 */ 
*SCONT = 0x10; /# 允许 接收 区 中 断 */ 


while (1); 大 连续 循环 */ 
} 


谨 中 断 服务 程序 */ 


interrupt void intserv() 


current_value = *RBUF:; /* 读 取 8 位 的 值 */ 
low_digit = current_value & OxOF:; 

high_digit = (current_value > > 4) & 0xOF; 

*PAOUT = table[low_digit]; /* 将 两 个 数字 发 送 */ 
*PBOUT = table[high_digit]; /* 到 七 段 显示 器 上 */ 





图 10-12 ( 续 ) 


10.4 ”反应 定时 器 一 一 一 个 完整 的 实例 


前 面 已 经 介绍 了 微 控 制 器 的 基本 特征 ， 现 在 说 明 如 何 将 它 用 在 一 个 简单 的 敌人 式 系 统 中 ， 
该 系统 实现 了 一 个 容易 理解 的 、 体 现 了 反应 系统 (reactive system ) 特征 的 任务 。 我 们 需要 设 
计 一 个 “反应 定时 器 "， 它 可 以 用 于 测量 人 们 对 于 视觉 刺激 的 反应 速度 。 设 计 思 想 是 需要 微 控 
制 器 去 打开 一 坊 灯 ， 然 后 测量 被 测 者 按 下 按钮 键 关 上 灯 所 经 历 的 反应 时 间 。 该 系统 的 细节 和 操 
作 描 述 如 下 : 

e 有 两 个 手动 的 按钮 键 Go 和 Stop 、 一 个 发 光 二 极 管 (LED ) 和 一 个 三 位 数 的 七 段 显示 器 。 

e 按 下 Go 键 ， 该 系统 被 激活 。 

e 激活 后 ， 七 段 显示 器 被 设置 成 000， 并 且 LED 是 关闭 的 。. 

e@ 经 过 三 秒 的 延 时 后 ，LED 被 打开 并 且 计 时 过 程 开 始 。 

当 Stop 键 被 按 下 时 ， 计 时 过 程 停止 ,LED 关闭 . 并 且 将 经 历 的 时 间 显 示 在 七 段 显示 器 上 。 
经 历 的 时 间 被 计算 出 来 ， 并 按 百 分 之 一 秒 的 格式 显示 。 由 于 显示 器 只 有 三 位 数 ， 所 以 
假定 经 历 的 时 间 将 少 于 10 秒 。 

图 10-13 描绘 了 能 实现 所 需 反 应 定时 器 的 硬件 。 这 里 的 微 控 制 器 提供 了 除 输 入 键 和 输出 
显示 以 外 的 所 有 硬件 组 件 。 跟 上 一 节 中 的 例子 不 同 ， 我 们 假设 每 一 个 七 段 显示 装置 都 与 一 个 
BCD- 七 段 译 码 器 电路 关联 起 来 ， 从 而 使 微 控制 器 只 需 为 每 个 显示 的 数字 发 送 一 个 四 位 的 BCD 
码 。 我 们 的 微 控制 器 没有 足够 的 并 行 端 口 来 同时 向 三 个 显示 器 发 送 编码 的 七 段 信号 。 
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图 10-13 反应 定时 器 电路 

我 们 将 使 用 两 个 并 行 端口 A 和 B 来 完成 所 有 的 输入 /输出 功能 。 所 显示 时 间 的 两 个 最 高 
有 效 BCD 位 连接 到 端口 A 上， 最 低 有 效 位 连接 到 端口 B 的 高 四 位 上 。 按 键 和 LED 连接 到 端 
口 B 的 最 低 三 位 上 。 计数器 /定时 器 电路 用 于 测量 经 历 的 时 间 ， 它 由 系统 时 钟 驱动 ， 我 们 假定 
系统 时 钟 具 有 100MHz 的 频率 。 

实现 这 个 任务 的 程序 可 以 基于 以 下 方法 完成 : 

e 用 户 想 开始 测试 的 意图 可 通过 一 个 等 待 循环 来 监视 ， 在 循环 中 反复 查询 Go 键 的 状态 。 

@ 当 观 察 到 Go 键 已 被 按 下 ， 也 就 是 发 现 PB, = 0 时 ， 再 延 时 三 秒 钟 之 后 打开 LED。 

e 计数 器 设置 成 初始 值 0xFFFFFFFF， 在 每 个 时 钟 脉冲 中 递减 计数 的 过 程 开始 。 

e 用 等 待 循环 去 查询 Stop 键 的 状态 ， 探 测 用 户 是 何 时 按 下 它 来 做 出 反应 的 。 

e 当 Stop 键 被 按 下 时 ，LED 关闭 ， 停 止 计数 并 计算 经 历 的 时 间 。 

。 将 测量 出 的 延迟 时 间 转 换 成 一 个 BCD 数 ， 并 发 送 到 七 段 显示 器 上 。 

微 控 制 器 中 各 种 IO 寄存 器 的 地 址 如 图 10-6 到 图 10-9 所 示 ， 程 序 必须 将 端口 A 和 B 配置 
成 图 10-13 所 示 连 接 所 需要 的 那样 。 端 口 A 的 所 有 位 和 端口 B 的 高 四 位 被 配置 成 输出 。 端 口 
B 的 低 三 位 中 的 PBo。 和 PB 用 做 输入 ， 而 PB; 是 一 个 输出 。 在 两 个 端口 中 不 需要 使 用 控制 信 
号 ， 因 为 输入 设备 是 由 直接 驱动 端口 线 的 按钮 键 构成 的 ， 而 输出 设备 是 一 个 显示 器 ， 当 驱动 显 
示 器 的 端口 引 脚 上 的 信号 有 任何 改变 时 ， 该 显示 器 就 会 显示 出 来 。 

我 们 将 说 明 如 何 用 C 程序 语言 来 实现 所 需 的 应 用 。 程 序 执行 下 列 任务 。 当 Go 键 被 按 下 
后 ， 用 定时 器 实现 三 秒 钟 的 延 时 。 由 于 计数 器 / 定时 器 电路 的 时 钟 为 100MHz， 计 数 器 被 初始 
化 为 十 六 进 制 值 11E1A300， 它 相当 于 十 进 制 值 300 000 000。 当 CTCONT。 位 被 置 成 1 时 递 
减 计数 过 程 开 始 。 当 计数 值 达到 0 时 ，LED 被 打开 ， 开 始 反应 时 间 测 试 ， 并 且 计 数 器 被 置 成 
0xFFFFFFFF。 当 检测 到 Stop 键 被 按 下 时 ， 设 置 CTCONT, = 1， 停 止 计数 过 程 。 总 计数 值 是 
这 样 计算 的 : 


第 10 章 散 入 式 系统 : 263 


总 计数 值 = 0xFFFFFFFF- 当前 计数 值 
因为 这 是 时 钟 周 期 的 总 数 ， 按 百 分 之 一 秒 计算 的 实际 时 间 是 : 
实际 时 间 王 总 计数 值 / 1000000 
这 个 二 进 制 数 可 以 转换 成 一 个 十 进 制 数 : 首先 用 这 个 二 进 制 整数 除 以 100， 以 生成 最 高 位 有 效 
数 。 余 数 再 除 以 10， 生 成 下 一 位 有 效 数 ， 最 后 的 余数 是 最 低位 有 效 数 。 
图 10-14 给 出 了 一 个 可 能 的 程序 ， 按 要 求 将 端口 A 和 B 进行 配置 并 关闭 显示 器 和 LED 

后 ， 该 程序 不 断 地 查询 引 脚 PB, 上 的 值 。 在 Go 键 被 按 下 ，PB, 变 成 0 后 ， 插 入 一 个 三 秒 钟 的 
延 时 。 然 后 LED 被 打开 并 且 反 应 计时 过 程 开 始 。 另 一 个 轮 询 操作 用 于 等 待 Stop 键 被 按 下 。 当 
这 个 键 被 按 下 时 ，LED 关闭 ， 计 数 器 停止 ， 并 且 读 出 计数 器 中 的 内 容 。 就 像 上 面 解释 的 那样 
完成 经 历时 间 的 计算 ， 并 将 其 转换 成 十 进 制 数 。 由 此 产生 的 三 个 BCD 数字 ， 根 据 图 10-13 所 
描述 的 结构 ， 被 写 人 端口 数据 寄存 器 。 

/* 定义 寄存 器 地 址 */ 

#define PAOUT (volatile unsigned char *) OxFFFFFFF!1 

#define PADIR (volatile unsigned char *) OxFFFFFFF2 

#define PBIN (volatile unsigned char *) OxFFFFFFF3 

#define PBOUT (volatile unsigned char *) OxFFFFFFF4 

#define PBDIR (volatile unsigned char *) OxFFFFFFFS 

#define CNTM (volatile unsigned int *) OxFFFFFFDO 


#define COUNT (volatile unsigned int *) OxFFFFFFD4 
#define CTCON (volatile unsigned char *) OxFFFFFFD8 


void main() 


{ 
unsigned int counter_value, total_count; 
unsigned int actual_time, seconds, tenths, hundredths; 


/# 初 始 化 并 行 端口 */ 


*PADIR = OxFF; 
*PBDIR = OxF4; 
*PAOUT = Ox0; 
*PBOUT = Ox4; 


/* 开始 测试 */ 

while (1) 

{ 
while ((*PBIN & 0x2) != 0); 
/*# 等 待 三 秒 钟 然后 打开 LED */ 
*CNTM = 0x11E1A300; 
*CTCONT = 0x1; 


while ((*CTSTAT & 0x1) == 0); 


*PBOUT = 0x0; 
/# 初始 化 计数 过 程 */ 


counter_value = 0; 
*CNTM = OxFFFFFFFF: 
*CTCONT = Ox1:; 


while ((*PBIN & 0xl) != 0); 


/* Stop 键 被 按 下 ， 停 止 计数 */ 
*CTCONT = 0x2; 

*PBOUT = 0x4; 
counter_value = *COUNT; 





/* 配置 端口 A*/ 
/* 配置 端口 B*/ 
人 # 关闭 显示 器 */ 
/* 和 LED*/ 


/* 连续 循环 */ 

/* 等 待 Go 键 被 按 下 */ 

/#* 设置 定时 器 值 为 300 000 000*/ 
/* 启动 定时 器 */ 


/# 等 待 直到 定时 器 达到 0*/ 
/* 打开 LED*/ 


/* 设置 起 始 计数 器 的 值 */ 
/# 开始 计数 */ 


/* 等 待 Stop 键 被 按 下 */ 


/# 停止 计数 器 */ 
/关闭 LED*/ 
/* 读 取 计数 器 的 内 容 */ 


图 10-14 用 于 反应 定时 器 的 C 程序 
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语 计 算 总 的 计数 值 */ 
total_count = (OxFFFFFFFF - counter_value); 


刻 将 计数 转换 为 时 间 */; 

actual_time = total_count/ 1000000; 访 以 1/100 秒 为 单位 的 时 间 */ 
seconds = actual_time/ 100; 

tenths = (actual_time ~ seconds * 100)/ 10; 

hundredths = actual_time - (seconds * 100 + tenths * 10); 


人 # 显示 经 过 的 时 间 */ 
*PAOUT = ((seconds < < 4) | tenths); 
*PBOUT = ((hundredths << 4) | 0x4); ”此 保持 LED 关闭 */ 





图 10-14 ( 续 ) 


10.5 ”传感器 与 执行 器 

和 冉 入 式 计算 机 与 其 所 处 的 环境 紧密 交互 。 到 目前 为 止 ， 我 们 已 经 使 用 开关 和 简单 的 显示 
设备 来 说 明 这 种 相互 作用 。 在 实际 的 应 用 中 会 使 用 多 种 其 他 的 设备 。 为 了 控制 一 个 机 械 系 统 ， 
需要 使 用 能 在 机 械 领域 和 计算 机 中 使 用 的 数字 电子 领域 之 间 提 供 接 口 的 设备 ， 它 能 够 使 计算 机 
感知 或 者 监控 被 控制 系统 的 状态 ， 还 会 引起 由 计算 机 控制 的 操作 的 执行 。 这 样 的 设备 通常 被 称 
为 传感器 ( sensor ) 和 执行 器 (actuator )。 它 们 被 统称 为 换 能 器 (transducer )。 在 这 一 节 中 , 我 
们 将 展示 几 个 传感器 的 例子 来 说 明 一 些 基 本 原则 。 


10.5.1 传感器 


根据 控制 系统 的 性 质 ， 艇 入 式 计 算 机 可 能 需要 监控 很 多 参数 。 考 虑 汽车 中 的 巡航 控制 系 
统 。 它 的 目的 是 将 速度 维持 在 尽 可 能 地 接近 所 需 值 的 水 平 ， 无 论 道路 是 水 平 的 还 是 上 坡 或 者 下 
坡 。 仅 简单 地 将 汽油 门 保持 在 一 个 固定 的 位 置 是 不 够 的 。 控 制 系统 必须 不 断 地 测量 汽车 的 速度 
并 调整 油门 开 度 使 其 维持 所 需 的 速度 。 因 此 ， 需 要 一 个 传感器 来 测量 汽车 的 速度 并 用 适用 于 计 
算 机 的 数字 形式 表示 出 来 。 然 后 计算 机 能 够 确定 油门 开 度 是 否 需 要 调整 ， 并 向 执行 器 发 送 命令 
以 促使 其 发 生 。 汽 车 中 还 有 许多 其 他 的 传感器 ， 包 括 测量 各 种 液体 ( 如 汽油 、 石 油 和 发 动机 冷 
却 液 ) 水 平 的 设备 。 传 感 器 可 以 监控 冷却 液 的 温度 、 轮 胎 的 气压 和 电池 的 电压 。 

有 一 些 传感器 是 比较 简单 的 ， 例 如 那些 检测 是 否 有 人 或 动物 沿 着 关闭 的 车 库 门 行走 的 传 
感 器 。 其 他 的 传感器 可 能 会 非常 复杂 。 下 面 给 出 几 个 传感器 的 例子 。 

1， 位 置 传感器 

考虑 一 台 艇 入 式 计算 机 ， 它 控制 机 器 人 的 手 部 运动 。 手 部 位 置 是 由 肩 、 肘 和 脑 关节 的 
角度 位 置 来 确定 的 。 为 了 监控 手 部 的 位 置 ， 计 算 机 必须 要 测量 这 些 关节 中 每 一 个 关节 的 角 
度 位 置 。 

测量 转轴 相对 于 其 外 壳 的 角度 位 置 的 一 种 简单 传感器 是 电位 计 。 它 包括 一 个 环绕 在 连接 
到 外 壳 上 的 圆 形 底座 周围 的 电阻 ， 和 一 个 连接 到 转轴 上 的 滑 块 触 点 ， 转 轴 的 位 置 是 被 监控 的 。 
当 转 轴 旋 转 时 ， 在 电阻 上 的 接触 点 会 改变 。 当 如 图 10-15 所 示 的 那样 连接 到 一 个 电源 上 时 ， 接 
触 点 任 一 侧 的 两 部 分 电阻 构成 一 个 分 压 器 。 这 个 电路 的 输出 电压 由 下 式 给 出 : 

Ra 
RI+R。 
这 个 电压 被 送 到 一 个 A /DD 转换 电路 中 ， 以 便 将 模拟 值 转换 成 数字 表示 形式 。 图 10-3 中 的 微 控 


Veit= 
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制 器 包含 一 个 可 用 于 这 种 情况 中 的 A/D 转换 器 。 





图 10-15 ”使 用 分 压 器 的 传感器 


有 一 些 传 感 器 可 直接 产生 一 个 数字 输出 。 例 如 ， 一 个 编码 的 盘 可 能 连接 到 一 个 转轴 上 ， 
该 转轴 的 位 置 被 监控 着 。 盘 上 的 编码 是 以 透明 和 不 透明 区 域 的 形式 组 织 在 同心 的 环形 区 域 中 ， 
如 图 10-16 所 示 。 盘 被 定位 在 发 光 二 极 管 和 光电 探测 器 之 间 ， 每 一 个 环形 区 域 有 一 对 发 光 二 极 
管 和 光电 探测 器 。 每 一 个 光电 探测 器 连接 到 一 个 电路 上 ， 该 电路 在 检查 到 光 时 就 产生 一 个 逻辑 
信号 1 否则 就 产生 0。 这 样 ， 当 盘旋 转 时 ， 图 中 所 示 的 两 个 光电 探测 器 就 产生 2 位 的 二 进 制 数 
00，01，10 和 11， 表 示 该 转轴 的 角度 位 置 。 

前 视图 侧 视图 


有 





WD | 信 表 
WD || a 
Fe 
LED 光电 探测 器 


图 10-16 ”一 种 光学 位 置 传感器 


.温度 传感器 1 

许多 类 型 的 传感器 利用 材料 在 温度 或 湿度 变化 时 其 特性 发 生 的 变化 ， 或 者 由 于 拉 伸 、 压 
缩 或 弯曲 造成 变形 的 结果 来 探测 。 一 个 导体 的 电阻 随 温 度 的 变化 而 变化 ， 其 效果 在 某 些 材料 
中 比 其 他 材料 更 明显 。 因 此 ， 使 用 一 个 类 似 于 图 10-15 中 的 分 压 器 ， 用 对 温度 变化 具有 较 高 敏 
感度 的 材料 制 成 电阻 忆 ， 并 将 其 暴露 在 待 测量 温度 的 环境 中 ， 由 此 可 以 构造 一 个 温度 传感器 。 
当 温 度 改 变 时 ， 电 压 发生 改 变 。 这 样 ， 在 将 Vu 转换 为 数字 表示 形式 后 ， 该 值 可 以 被 计算 
机 读 取 以 作为 对 温度 的 测量 值 。 其 他 类 型 的 温度 传感器 使 用 电容 器 作为 传 感 元 件 。 电 容 的 电容 
量 随 着 构造 电容 所 使 用 的 电介质 〈 绝 缘 材 料 ) 的 特性 变化 而 变化 。 一 些 陶瓷 材料 也 很 适合 用 于 
温度 传感器 中 。 


408 
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3， 压 力 传感器 
应 变 计 是 一 种 广泛 使 用 的 传感器 ， 它 是 由 一 个 放 在 软 膜 上 的 电阻 组 成 ， 用 于 测量 电阻 中 


的 变化 。 当 薄膜 被 拉 伸 时 ， 电 阻 值 发 生 改变 
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假设 我 们 希望 监控 一 个 封闭 容器 内 (如 汽车 轮胎 ) 的 空气 压力 。 压 力 传感器 可 以 构造 成 
一 个 其 一 端 连接 有 一 个 膜 片 的 小 圆 简 以 及 一 个 安装 在 膜 片 上 的 应 变 计 的 形式 。 将 圆 简 插 入 到 容 
器 中 ， 这 样 膜 片 阻止 空气 流出 这 个 容器 。 当 该 容器 被 加 压 时 ， 膜 片 拉 伸 ， 应 变 计 的 电阻 改变 。 
可 以 用 类 似 于 图 10-15 中 的 电路 来 测量 电阻 的 改变 。 

4.， 速度 传感器 

将 一 个 小 的 发 电机 连接 到 旋转 轴 上 ， 能 产生 一 个 与 旋转 速度 成 正比 的 电压 。 发 电机 的 输 
出 电压 可 以 转换 成 数字 形式 ， 并 被 计算 机 读 取 以 作为 对 速度 的 测量 值 。 这 种 装置 通常 被 称 为 转 
速 计 。 

另 一 种 方法 是 当 转 轴 旋 转 时 产生 电 脉冲 。 例 如 ， 将 齿 形 盘 连 接 到 转轴 上 。 当 盘旋 转 时 ， 
其 每 个 齿 通 过 一 个 适当 放置 的 电磁 或 光 传感器 都 会 产生 一 个 电 脉冲 。 通 过 对 一 个 固定 的 时 间 周 
期 中 所 产生 的 脉冲 数量 进行 计数 ， 或 者 测量 连续 脉冲 之 间 的 时 间 延 迟 即 可 确定 旋转 速度 。 


10.5.2 ”执行 器 

执行 器 是 一 种 在 接收 到 命令 后 使 线圈 
得 机 器 部 件 移动 的 装置 。 图 10-17 说 
明了 构造 各 种 执行 器 的 基本 原则 。 电 
线 被 缠绕 在 圆 简 周围 形成 一 个 线圈 ， 

圆 简 中 包含 一 个 叫做 电 枢 (armature) 560606560655 弹簧 

的 可 动 铁心 。 这 种 结构 被 称 为 螺 线 管 。 图 10.17 螺 线 管 执行 器 

电 枢 可 使 用 像 铁 这 样 的 磁性 材料 来 制 

造 ， 通 过 一 个 弹 自 将 其 保持 在 部 分 插入 圆 简 中 的 位 置 ， 如 图 所 示 。 当 有 电流 流 经 线圈 时 ， 它 产 
生 一 个 磁场 ， 将 电 枢 拉 和 人 圆 简 中 。 当 电流 停止 流动 时 ， 电 枢 被 弹簧 拉 回 其 静止 位 置 。 电 枢 的 运 
动 可 以 用 来 打开 水 阅 ， 或 关闭 电机 的 开关 。 这 种 结构 还 可 用 在 汽车 的 起 动 电机 中 。 

电机 和 传感器 组 合 起 来 ， 可 用 于 将 一 个 对 象 移动 到 所 需 的 位 置 。 当 电机 打开 ， 这 个 对 象 
就 开始 移动 。 然 后 计算 机 就 可 以 使 用 传感器 来 重复 检测 是 否 已 到 达 所 需 的 位 置 。 在 具有 自动 对 
焦 功 能 的 照相 机 中 ， 电 机 使 调 焦 装 置 旋转 。 与 此 同时 ， 计 算 机 使 用 图 像 分 析 算 法 来 检测 图 像 是 
否 被 正确 地 对 焦 。 当 达到 最 佳 的 焦点 时 ， 它 就 停止 电机 。 

另 一 种 有 用 的 执行 器 是 步 进 电机 ， 该 电机 能 响应 脉冲 形式 的 命令 使 转轴 旋转 。 每 一 个 脉 

冲 使 电机 轴 旋 转 一 个 预定 量 ， 如 旋转 几 度 。 步 进 电机 在 需要 精确 控制 对 象 ( 如 机 器 人 的 手臂 ) 
位 置 的 应 用 中 非常 有 用 。 
， ”上 面 介绍 的 传感器 和 执行 器 构成 了 计算 机 及 其 所 符 入 的 物理 环境 之 间 的 接口 。 它 们 向 计 
算 机 提供 了 监控 各 种 系统 组 件 的 状态 和 促使 所 需 的 动作 发 生 的 能 力 。 传 感 器 为 计算 机 提供 了 关 
于 系统 状态 的 一 些 信息 ， 而 执行 器 则 接收 命令 并 执行 这 些 命令 所 指定 的 功能 。 计 算 机 的 任务 是 
实现 应 用 所 需 的 控制 算法 ， 它 同时 也 接收 来 自用 户 的 命令 并 将 信息 显示 给 用 户 。 


eeeeeeeeegSeg@e@ 电 枢 


10.5.3 ”应 用 实例 
现在 我 们 简要 地 介绍 两 个 应 用 ， 来 说 明 如 何 使 用 传感器 和 执行 器 。 
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1 家庭 供暖 控制 

家 中 的 暖气 和 空调 是 由 一 个 叫做 恒温 器 的 装置 来 控制 的 。 让 我 们 来 看 一 下 供暖 炉 的 控制 。 
在 恒温 器 中 加 入 一 个 微 控制 器 ， 可 以 实现 像 在 一 天 的 不 同时 间或 周末 自动 改变 所 需 的 温度 这 样 
的 功能 。 这 样 的 恒温 器 包含 了 : 

e 一 个 温度 传感器 

e 产生 输出 信号 使 供暖 炉 打开 或 关闭 的 电路 

e 一 个 用 来 跟踪 一 天 时 间 和 一 周 时 间 的 定时 器 

e 可 供用 户 输入 所 需 设置 值 的 按钮 键 

@ 一 个 显示 屏 

在 这 里 我 们 将 只 讨论 温度 控制 机 制 。 假 设 我 们 使 用 了 10.5.1 节 中 描述 的 电阻 温度 传感器 ， 
并 假设 其 输出 电压 连接 到 微 控 制 器 中 的 A/D 转换 器 上 。 螺 线 管 用 来 激活 一 个 能 将 炉子 打开 或 
关闭 的 开关 。 控 制 算 法 由 微 控 制 器 中 的 一 个 程序 实现 。 假 设 所 需 的 温度 被 设置 为 了 度 ， 并 人 允许 
房间 的 实际 温度 偏离 该 设置 值 一 个 较 小 的 偏 移 量 A7 ( 高 于 或 低 于 所 需 的 值 )。 然 后 ， 可 通过 反 
复 执行 以 下 动作 来 实现 控制 任务 : 

1 ) 对 温度 传感器 进行 采样 以 获得 表示 温度 的 输入 电压 。 

2 ) 如 果 温 度 低 于 7 一 AT， 则 打开 供暖 炉 。 

3 ) 如 果 温 度 高 于 T+ AT， 则 关闭 供暖 炉 。 

该 计算 机 程序 的 其 余部 分 处 理 这 些 任 务 : 使 用 定时 器 来 跟踪 时 间 ， 通 过 按钮 键 接收 用 户 的 
输入 ， 将 信息 发 送 到 显示 器 上 。 

2.， 巡航 控制 

许多 汽车 中 的 巡航 控制 系统 需要 以 下 组 件 : 

e 一 个 测量 汽车 驱动 轴 速 度 的 传感器 

e@ 一 个 控制 汽油 门 位 置 的 执行 器 

e 驾驶 员 用 来 激活 系统 和 设置 所 需 速度 的 输入 按钮 

这 个 应 用 与 家 庭 供 暧 系统 的 不 同 点 在 于 它 所 控制 的 参数 一 一 油门 的 位 置 一 一 是 在 完全 关 
闭 或 者 完全 打开 这 两 个 极端 之 间 连 续 变 化 。 在 上 一 个 例子 中 使 用 的 简单 开 / 关 控制 算法 在 这 里 
是 不 合适 的 。 当 控制 一 个 像 油门 位 置 这 样 的 变化 量 时 ， 需 要 更 复杂 的 算法 ， 该 算法 的 讨论 已 经 
超过 了 本 书 的 范围 。 然 而 ， 所 需 的 动作 可 简单 描述 如 下 。 计 算 机 反复 测量 汽车 的 速度 并 与 原来 
设置 的 值 进行 比较 。 比 较 的 差 值 为 误差 s， 它 可 能 为 正 或 者 为 负 。 根 据 s 的 值 ， 计 算 机 对 油门 
位 置 作 微小 调整 。 我 们 的 目标 是 维持 一 个 尽 可 能 接近 0 的 s 值 。 实 际 上 ， 计 算 机 模仿 了 手动 操 
控 汽 车 并 保持 恒定 速度 的 驾驶 员 的 决策 和 动作 。 


10.6 ” 微 控制 器 系列 


我 们 已 经 在 10.3 节 给 出 了 一 个 微 控 制 器 的 例子 ， 现 在 来 简要 地 讨论 一 些 商用 的 微 控 制 器 
芯片 。 许多 嵌 人 式 应 用 不 需要 功能 很 强 的 处 理 器 ， 显 然 ，10.1.1 节 中 讨论 的 微波 炉 就 不 需要 功 
能 强大 的 微 控制 器 ， 因 为 它 需 要 的 计算 相当 简单 ， 并 且 对 反应 时 间 的 要 求 不 高 。 针 对 这 样 的 应 
用 最 好 是 使 用 这 样 一 种 芯片 ， 它 包括 一 个 简单 的 处 理 器 ， 但 同时 还 含有 足够 的 存储 器 和 IO 资 
源 以 实现 所 有 的 控制 器 功能 。 在 10.1.2 节 中 讨论 的 数码 照相 机 就 有 高 得 多 的 计算 需求 ， 因 此 它 
就 需要 使 用 一 个 功能 比较 强 的 处 理 器 。 

处 理 器 的 性 能 可 以 用 访问 存储 器 数据 时 能 够 并 行 处 理 多 少 个 数据 位 来 衡量 。 目 前 最 强 
大 的 微 控 制 器 可 能 是 基于 一 个 32 位 的 处 理 器 构成 的 ， 它 具有 32 位 宽 的 数据 总 线 。 某 些 基于 
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ARM 体系 结构 的 微 控制 器 就 是 这 样 的 。 微 控制 器 也 可 能 有 一 个 32 位 内 部 结构 的 处 理 器 , 但 只 
有 16 位 宽 的 数据 总 线 连 到 存储 器 上 。 微 控制 器 Freescale 68K/ColdFire 系列 就 是 这 样 的 例子 。 
一 些 最 流行 的 微 控制 器 是 8 位 的 芯片 。 它 们 非常 便宜 ， 但 是 其 功能 足以 满足 大 量 伐 人 式 应 用 的 
需要 。 还 有 更 小 的 4 位 的 芯片 ， 由 于 它们 的 简单 性 和 极 低 的 成 本 ， 所 以 也 极 具 吸引 力 。 


10.6.1 基于 Intel 8051 的 微 控制 器 

在 20 世纪 80 年 代 初 ，Intel 公司 推出 了 一 款 称 为 8051 的 微 控制 器 芯片 。 这 个 芯片 具 
有 Intel 8080 微 处 理 器 系列 的 基本 体系 结构 ， 它 使 用 8 位 的 芯片 ， 可 用 于 通用 的 计算 应 用 中 。 
8051 芯片 得 到 了 快速 的 普及 ， 并 已 成 为 在 实际 中 使 用 最 为 广泛 的 芯片 之 一 。 它 有 四 个 8 位 的 
IO 端口 、 一 个 UART 和 两 个 16 位 的 计数 器 /定时 器 电路 。 它 还 包含 有 4K 字 节 的 ROM 和 
128 字 节 的 RAM 存储 器 。 该 芯片 的 EPROM 版 本 中 包含 有 4K 字 节 的 EPROM 而 不 是 ROM， 
它 被 命名 为 8751。 

还 有 许多 基于 8051 体系 结构 的 芯片 ; 它们 进行 了 不 同 程度 的 改进 。 例 如 ，8052 芯片 有 
8K 字 节 的 ROM 和 256 字 节 的 RAM， 还 有 一 个 附加 的 计数 器 /定时 器 电路 。 它 的 EPROM 版 
本 被 称 为 8752。 

8051 体系 结构 由 Intel 公司 开发 。 后 来 ,许多 其 他 半导体 制造 商 生产 的 芯片 要 么 与 8051 
系列 的 芯片 相同 ， 要 么 有 一 些 增强 的 功能 ， 但 在 其 他 方面 与 8051 完全 兼容 。 


10.6.2 ”Freescale 微 控制 器 


在 20 世纪 80 年 代 ，Motorola 在 微 处理 器 芯片 的 制造 商 中 占据 着 主导 地 位 。 它 们 最 流行 的 
8 位 微 处 理 器 成 为 微 控 制 器 的 基础 。Freescale 半导体 公司 是 Motorola 在 这 一 领域 的 继任 者 。 基 
于 不 同 的 处 理 器 核 ，Freescale 生产 了 各 种 各 样 的 微 控制 器 。 

1. 68HC11 微 控 制 器 

Motorola 最 流行 的 8 位 微 处 理 器 是 6800 和 6809。 后 来 推出 的 68HC11 微 控制 器 芯片 实现 
了 6800 指令 集 的 超 集 。 它 有 五 个 可 以 用 于 各 种 目的 的 IO 端口 。 IO 结构 中 包括 两 个 串 行 接口 。 
它 还 有 能 够 在 若干 不 同 模式 下 进行 操作 的 计数 器 / 定时 器 电路 。 

68HC11 芯片 中 的 存储 器 总 量 范 围 从 原来 芯片 中 一 个 8K 字 节 的 ROM、 一 个 512 字 节 
的 EEPROM 和 一 个 256 字 节 RAM 到 之 后 芯片 中 一 个 12K 字 节 的 ROM、 一 个 512 字 节 的 
EEPROM 和 一 个 512 字 节 RAM。 

2，68K 微 控 制 器 

68K 系列 的 微 控 制 器 是 基于 32 位 的 68000 处 理 器 核 构成 的 。 为 了 减少 引 脚 的 数量 ， 外 
部 数据 总 线 只 有 16 位 宽 。 这 一 系列 的 芯片 包含 有 并 行 和 串 行 端口 、 计 数 器 / 定时 器 以 及 
A/D 转换 电路 。 片 上 存储 器 的 总 量 因 芯 片 的 不 同 而 不 同 。 比 如 ，68376 芯片 有 一 个 8K 字 节 的 
EEPROM 和 一 个 4K 字 节 的 RAM。 

3，ColdFire 微 控制 器 

68000 指令 集体 系 结构 为 附录 C 中 介绍 的 32 位 ColdFire 处 理 器 和 被 称 为 ColdFire 通 人 
式 处 理 器 的 MCF5xxx 微 控 制 器 提供 了 基础 。 它 们 的 显著 特点 是 使 得 性 能 得 到 大 大 提高 的 流 
水 线 结构 。 外 部 数据 总 线 的 宽度 可 以 是 16 位 或 者 32 位 的 ， 这 取决 于 所 选择 的 微 控制 器 芯片 。 
ColdFire 处 理 器 核 也 是 为 了 用 于 片上 系统 ( system-on-a-chip ) 环境 而 设计 的 ， 片 上 系统 将 在 
第 11 章 中 讨论 。 
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4. PowerPC 微 控制 器 

Freescale 的 高 端 32 位 微 处 理 器 系列 被 称 为 PowerPC， 它 是 基于 RISC 风格 的 体系 结构 建 
立 的 。 目 前 也 可 以 见 到 以 这 种 处 理 器 体系 结构 建立 的 微 控 制 器 ， 比 如 包括 MPC5xx 系列 在 内 
的 芯片 。 


10.6.3 ARM 微 控制 器 

在 附录 D 中 给 出 的 ARM 体系 结构 对 于 艇 人 式 系统 是 具有 吸引 力 的 ， 因 为 嵌入 式 系统 需 
要 可 靠 的 计算 能 力 ， 并 且 成 本 和 功 耗 相 对 比较 低 。ARM 处 理 器 设计 的 一 个 主要 目标 是 使 其 适 
合 于 片上 系统 的 环境 。ARM 微 控 制 器 也 可 以 作为 一 个 单独 的 芯片 使 用 。 

已 经 有 一 系列 的 ARM 处 理 器 核 用 于 了 氨 入 式 应 用 中 ， 包 括 ARM6、ARM7、ARM9、 
ARM10 和 ARM Cortex。 基 本 的 ARM 体系 结构 使 用 32 位 的 组 织 和 一 个 所 有 指令 都 是 32 位 长 
的 指令 集 。 还 存在 另 一 种 版 本 ， 称 为 Thumb ( 拇指 ) 型 ， 它 使 用 16 位 的 指令 和 16 位 的 数据 
ee 该 子 集 被 编码 成 适合 16 位 的 格式 。 它 包含 的 
寄存 器 也 比 ARM 体系 结构 少 一 些 。Thumb 的 优势 是 只 需要 使 用 相当 小 的 存储 器 来 存储 由 高 
度 编 码 的 16 位 指令 构成 的 程序 每 个 Thumb 指令 被 扩展 成 正常 的 32 位 ARM 指 
邻 。 因 此 ， 一 个 Thumb 型 的 ARM 核 中 除了 正常 的 电路 外 ， 还 包含 有 一 个 Thumb 解压 缩 准 于 


( Thumb decompressor )。 


10.7 设计 问题 

一 个 散人 式 系统 的 设计 者 必须 做 出 许多 重要 的 决定 。 对 实际 应 用 或 是 将 要 设计 的 产品 的 
I 一 些 最 重要 的 问题 。 

. 成 本 

pp 用 中 电子 设备 的 成 本 必须 是 低廉 的 ， 如 果 单 个 芯片 能 实现 所 有 必需 的 功 
能 ， 则 可 实现 成 本 最 低 的 解决 方案 。 只 有 当 该 芯片 能 提供 足够 的 IO 能 力 来 满足 应 用 的 需求 以 
及 有 充足 的 片上 存储 器 来 存放 必需 的 程序 和 数据 时 ， 做 到 这 一 点 才 是 可 能 的 。 

2.， I/O 能 力 

微 控制 器 芯片 提供 多 种 IO 资源 ， 从 简单 的 并 行 和 串 行 端口 到 计数 器 、 定 时 器 以 及 A/D 
和 D/A 转换 电路 。 可 用 的 VO 线 数 是 重要 的 ， 没 有 足够 的 IO 线 时 需要 使 用 外 部 电路 去 补充 
它 。 这 已 经 在 图 10-13 的 反应 定时 器 例子 中 作 了 说 明 ， 其 中 外 部 译 码 器 电路 用 于 驱动 由 微 控制 
器 提供 的 4 位 BCD 信和 号 的 七 段 显 示 器 。 如 果 微 控制 器 有 四 个 而 不 是 两 个 并 行 端口 ， 那 么 就 可 
以 将 每 个 七 段 显示 器 与 一 个 端口 相连 。 然 后 控制 程序 就 可 以 直接 地 生成 每 个 显示 器 中 驱动 七 个 
单独 的 段 所 需要 的 七 位 信号 。 

3. 规格 

控制 器 芯片 有 各 种 不 同 的 规格 ， 如 果 一 个 应 用 用 8 位 的 微 控 制 器 就 足够 处 理 了 ， 就 没有 
必要 使 用 可 能 价格 比较 昂贵 、 尺 寸 比较 大 并 且 消 耗 更 多 功率 的 16 位 或 32 位 的 芯片 。 实 际 中 大 
多 数 的 应 用 可 以 使 用 相对 较 小 的 芯片 进行 处 理 。 

4. 功 耗 

功 耗 在 所 有 的 计算 机 应 用 中 是 一 个 重要 的 考虑 因素 。 在 高 性 能 的 系统 中 功 耗 很 高 ， 需 要 
增加 一 些 机 制 来 驱散 产生 的 热量 。 在 许多 嵌 人 式 应 用 中 所 消耗 的 功率 很 低 ， 所 以 散热 就 不 是 
一 个 问题 。 但 是 ， 这 些 应 用 通常 是 电池 供电 的 产品 ， 所 以 电池 的 寿命 ( 取决 于 功 耗 ) 是 主要 
的 因素 。 
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5， 片 上 存储 器 

在 微 控 制 器 芯片 中 包含 存储 器 会 使 得 简单 的 姐 入 式 应 用 可 以 使 用 单个 蕊 片 来 实现 。 存 储 
器 的 大 小 和 类 型 有 很 大 的 差异 。 相 对 小 容量 的 RAM 可 能 足够 存储 计算 中 的 数据 。 存 储 程序 需 
要 一 个 较 大 的 只 读 存 储 器 ， 这 个 存储 器 可 以 是 ROM、PROM、EPROM、EEPROM 或 闪存。 对 
于 大 容量 的 产品 ， 最 为 经 济 的 选择 是 采用 带 ROM 的 微 控 制 器 。 但 是 ， 这 也 是 一 种 最 不 灵活 的 
选择 ， 因 为 ROM 中 的 内 容 在 芯片 制造 时 就 被 永久 设置 了 。 最 灵活 的 应 用 是 由 EEPROM 和 内 
存 提供 的 存储 方式 ， 它 们 可 以 被 多 次 编程 。 

对 于 有 更 大 存储 要 求 的 应 用 ， 需 要 使 用 外 部 存储 器 。 有 些微 控制 器 不 包含 任何 的 片上 存储 
器 ， 它 们 通常 用 于 所 需要 的 存储 总 量 非常 大 ， 不 能 在 微 控制 器 芯片 内 部 实现 的 更 复杂 的 应 用 中 。 

6.， 性 能 

当 微 控制 器 在 家 用 设备 和 玩具 这 样 的 应 用 中 使 用 时 ， 性 能 通常 不 是 一 个 重要 的 考虑 因素 。 
在 这 种 情况 下 可 以 选择 小 型 并 且 便 宜 的 芯片 。 但 是 ， 在 数码 相机 、 移 动 电话 和 一 些 手持 视频 游 
戏 机 这 样 的 应 用 中 就 需要 有 更 高 的 性 能 。 高 性 能 就 需要 比较 强大 的 芯片 ， 并 会 导致 更 高 的 费用 
和 更 大 的 功 耗 。 由 于 这 些 应 用 通常 是 用 电池 供电 的 ， 所 以 降低 功 耗 也 是 很 重要 的 。 需 要 进行 多 
方面 的 权衡 以 满足 这 些 相互 冲突 的 目标 。 

7， 软 件 

使 用 高 级 计算 机 语言 编写 应 用 程序 有 许多 优势 ， 它 们 使 程序 开发 过 程 变 得 简单 并 且 使 将 
来 的 软件 维护 和 修改 工作 更 加 容易 。 但 是 ， 在 有 些 情况 下 求助 于 汇编 语言 可 能 会 更 加 理想 或 
有 必要 。 一 个 精心 设计 的 汇编 语言 程序 生成 的 目标 代码 可 能 会 比 由 编译 程序 生成 的 代码 压缩 
10% 一 20% ( 就 需要 的 存储 总 量 来 讲 )。 如 果 一 个 嵌入 式 应 用 是 基于 具有 有 限 的 片上 存储 器 的 
微 控 制 器 而 建立 的 ， 那 么 如 果 所 需 的 代码 能 放 进 芯片 上 提供 的 存储 器 中 ， 就 避免 了 外 部 存储 器 
的 使 用 ， 这 将 是 一 个 主要 的 优势 。 

对 于 系统 设计 者 来 说 ， 片 上 RAM 的 有 限 容量 是 一 个 重要 的 考虑 因素 。 这 种 存储 器 通常 用 
于 存储 动态 数据 ， 就 像 一 个 临时 缓冲 区 ， 或 是 用 于 实现 堆栈 。 当 用 高 级 语言 (如 C ) 编写 一 个 
应 用 程序 时 ， 必 须 小 心 ， 以 确保 代码 和 数据 的 总 量 不 超过 可 用 存储 器 的 容量 。 

8， 指 令 集 

另 一 个 重要 的 问题 是 处 理 器 所 使 用 指令 集 的 特性 。CISC 风格 的 指令 比 RISC 风格 的 指令 
产生 更 紧凑 的 代码 。 因 此 ， 处 理 器 的 选择 对 代码 的 大 小 也 有 影响 。ARM 体系 结构 的 Thumb 版 
本 提供 了 解决 这 个 问题 的 方法 的 一 个 有 趣 例子 ， 其 中 为 32 位 处 理 器 设计 的 RISC 风格 的 指令 
集 已 经 被 修改 成 了 使 用 16 位 指令 的 更 高 度 的 编码 形式 ， 这 在 10.6.3 节 中 讨论 过 。 为 Thumb 版 
本 编写 的 程序 比 为 完全 ARM 体系 结构 编写 的 程序 紧凑 了 30%。 

9. 开发 工具 

数字 系统 的 设计 者 对 开发 工具 的 依赖 性 很 强 。 这 些 开发 工具 包括 计算 机 辅助 设计 (CAD ) 
软件 包 、 编 译 器 、 汇 编程 序 及 处 理 器 的 模拟 器 。 开 发 工具 的 范围 和 可 用 性 通常 依赖 于 所 选择 的 
嵌入 式 处 理 器 。 有 第 三 方 支持 也 是 非常 具有 了 吸 引力 的 ， 因 为 在 第 三 方 那里 有 可 蔡 代 的 工具 和 文 
档 。 良 好 的 文档 和 来 自 于 制造 商 的 有 益 的 建议 ( 如 果 需 要 的 话 ) 都 是 非常 宝贵 的 。 

10， 可 测试 性 和 可 靠 性 

印刷 电路 板 通 常 是 很 难 测 试 的 ， 尤 其 是 当 板 上 组 装着 密集 的 芯片 时 。 如 果 将 整个 系统 设 
计 成 容易 测试 的 方式 ， 那 么 测试 过 程 就 会 大 大 简化 。 一 个 微 控制 器 芯片 可 以 包含 一 些 电 路 ， 这 
些 电路 可 以 使 包含 该 芯片 的 印刷 电路 板 比较 容易 测试 。 例 如 ， 在 有 些微 控制 器 中 包含 有 一 个 测 
试 访问 端口 〈test access port )， 它 与 用 于 可 测试 结构 的 IEEE 1149.1 标准 兼容 ， 该 标准 被 称 为 
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测试 访问 端口 和 边界 扫描 结构 标准 [1]。 
艇 人 式 应 用 要 求 具 有 稳健 性 和 可 靠 性 。 一 个 典型 产品 的 生命 周期 希望 最 少 可 达到 5 年 以 
上 。 这 一 点 与 个 人 计算 机 不 同 ， 个 人 计算 机 容易 在 短期 内 被 淘汰 。 


10.8 ”结束语 

这 一 章 介绍 了 嵌入 式 计算 机 系统 的 设计 。 我 们 没有 使 用 某 个 具体 的 商用 微 控制 器 进行 讨 
论 ， 因 为 所 介绍 的 原则 是 通用 的 并 且 处 理 的 也 是 嵌入 式 系统 设计 者 要 面 对 的 核心 问题 。 

理解 硬件 和 软件 间 密 切 的 相互 作用 是 非常 重要 的 。 设 计 选 择 可 能 包括 对 轮 询 WO 和 中 汤 的 
权衡 、 不 同 的 指令 集 间 根 据 功 能 和 代码 紧凑 性 的 权衡 、 功 耗 和 性 能 间 的 权衡 ， 等 等 。 

在 这 一 章 中 我 们 讨论 了 使 用 微 控 制 器 实现 息 人 式 系统 ， 在 下 一 章 中 ,我 们 将 介绍 如 何 使 
用 FPGA 芯片 来 实现 这 样 的 系统 。 特 别 地 ， 我 们 将 集中 讨论 片上 系统 方法 ,试图 在 单个 芯片 上 
实现 整个 系统 。 

最 后 ， 我 们 讨论 了 骨 入 式 系统 不 同 于 通用 计算 机 的 特点 。 基 本 原则 是 相同 的 。 典 人 式 系 
统 的 设计 者 必须 很 熟悉 计算 机 的 组 织 结构 ， 对 包括 指令 系统 、 程 序 的 执行 、 输 入 /输出 技术 、 
存储 器 结构 以 及 与 系统 中 可 能 包含 的 各 种 设备 进行 交互 的 接口 方案 都 要 有 一 个 透彻 的 理解 。 那 
么 ， 有 什么 不 同 呢 ? 

通用 计算 机 执行 任意 的 应 用 程序 ， 包 括 那些 用 来 创建 或 修改 其 他 程序 的 应 用 程序 。 由 于 
处 理 算 法 或 者 用 户 的 控制 ， 每 个 程序 通常 运行 一 段 有 限 的 时 间 。 在 处 理 器 芯片 外 部 需要 有 一 个 
大 的 主 存 ， 以 满足 一 些 应 用 程序 的 潜在 的 大 容量 需求 。 也 需要 大 容量 的 辅助 存储 设备 来 存放 包 
含 程 序 和 数据 的 文件 。 一 个 复杂 的 操作 系统 用 于 控制 计算 机 系统 中 的 所 有 资源 。 

相 比 之 下 ， 肉 入 式 系统 通常 执行 一 个 不 太 可 能 被 修改 的 单一 的 应 用 程序 。 当 系统 启动 时 ， 
这 个 程序 会 自动 开始 执行 ， 并 且 程 序 的 执行 是 连续 不 断 的 ， 直 到 系统 关闭 。 存 储 器 的 需求 往往 
是 很 小 的 ， 通 常 有 可 能 使 用 一 个 具有 足够 的 片上 存储 器 的 微 控 制 器 。 不 需要 功能 强大 的 操作 系 
统 软件 。 在 很 多 情况 下 ， 是 没有 操作 系统 软件 的 。 这 个 单一 的 应 用 程序 连续 不 断 地 执行 ， 并 直 
接 访 问 所 有 的 处 理 器 、 存 储 器 和 输入 /输出 资源 。 

我 们 的 讨论 集中 在 低 端的 嵌入 式 系统 ， 其 计算 需求 相对 较 小 。 这 种 系统 体现 了 嵌入 式 应 
用 的 主要 原则 。 但 是 ， 也 有 很 多 高 端的 做 和 人 式 系统 ， 比 如 那些 用 于 飞机 和 高 速 列 车 中 的 系统 ， 
它们 需要 相当 强大 的 计算 能 力 ， 往 往 使 用 多 个 处 理 器 来 实现 。 第 12 章 我 们 会 讲解 与 多 处 理 器 
系统 有 关 的 问题 。 


习题 

[M] 10.1 在 例 10.2 中 ,我 们 假设 IO 设备 能 以 位 串 方式 发 送 8 位 数据 。 现 在 考虑 一 个 使 用 八 根 线 的 类 似 
设备 ， 它 并 行 发 送 数据 。 这 样 ， 微 控制 器 中 的 一 个 并 行 端口 必须 被 用 来 接收 数据 。 这 只 留 下 一 
个 并 行 端口 来 显示 表示 数据 的 两 个 十 六 进 制 数字 。 因 此 ， 只 能 使 用 一 个 图 3-17 所 示 的 七 段 显示 
设备 。 为 了 传达 接收 到 的 信息 ， 可 以 让 这 一 个 设备 依次 地 显示 数字 。 先 使 最 高 有 效 位 数字 显示 
一 秒 钟 ， 随 后 是 一 秒 钟 的 空白 期 ， 然 后 第 二 位 数字 显示 一 秒 钟 。 显 示 第 二 位 数字 后 ， 显 示 器 将 
会 显示 两 秒 钟 的 “一 ”( 破 折 号 )。 这 个 序列 将 被 不 断 地 重复 显示 ， 以 反映 收 到 的 最 新 数据 。 使 
用 图 10-9 中 的 定时 器 ， 并 假设 它 被 一 个 100MHz 的 时 钟 驱 动 。 给 出 必要 的 硬件 连接 ， 并 写 一 个 
程序 来 实现 所 需 的 任务 。 使 用 轮 询 方式 来 检查 定时 器 的 状态 。 

[M] 10.2 使 用 定时 器 的 中 断 能 力 来 解决 习题 10.1 中 的 问题 。 

[M] 10.3 使 用 10.3 节 描 述 的 微 控 制 器 来 控制 包含 一 个 能 在 两 种 速度 ( 快速 和 慢 速 ) 下 运行 的 电机 的 系 
统 。 跟 电机 相关 联 的 传感器 使 用 一 根 信号 线 来 指示 电机 的 当前 速度 。 对 于 快 的 速度 ， 传 感 器 传 
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输 一 个 频率 为 100kHz 的 、 连 续 的 方 波 信号 ， 对 于 慢 的 速度 ， 它 传输 50kHz 的 信号 。 如 果 电 机 
不 运行 ， 它 就 不 传送 信号 ( 即 恒定 的 逻辑 值 0 )。 微 控制 器 使 用 图 3-17 所 示 的 七 段 显示 器 来 将 
电机 的 状态 显示 为 F，S 或 者 0。 给 出 必要 的 硬件 连接 ， 并 写 一 个 程序 来 实现 所 需 完 成 的 任务 。 
使 用 图 10-9 中 的 定时 器 来 生成 测试 传感器 所 发 出 信号 的 频率 所 需 的 时 间 间 隅 。 假 设 定时 器 由 
100MHz 的 时 钟 驱动 ， 使 用 轮 询 方式 来 检查 定时 器 的 状态 . 

[M] 10.4 使 用 定时 器 的 中 断 能 力 来 解决 习题 10.3 中 的 问题 。 

[D] 10.5 使 用 10.3 节 中 的 微 控制 器 在 它 的 串 行 端口 上 接收 十 进 制 数 。 每 个 数 由 两 个 ASCII 码 字符 的 数字 
编码 组 成 ， 为 了 区 分 连续 的 两 位 数字 的 数 ， 使 用 H 作为 定 界 符 。 这 样 ， 如 果 两 个 连续 的 数 是 43 
和 28， 那 么 接收 到 的 序列 将 是 H43H28。 每 个 数 将 被 显示 在 连接 到 并 行 端 口 A 和 了 B 上 的 两 个 七 
段 显示 器 上 。 定 界 符 不 应 该 被 显示 出 来 。 只 有 当下 一 个 数 的 两 位 数字 都 接收 到 时 显示 的 数 才 会 
被 改变 。 给 出 完成 这 种 功能 所 需要 的 连接 ， 如 图 3-17 所 示 的 那样 标记 显示 器 单元 的 段 。 写 一 个 
程序 执行 所 需 完成 的 任务 。 使 用 图 10-8 中 的 串 行 接口 ， 并 使 用 轮 询 方 式 检测 每 个 ASCII 码 字符 
是 否 到 达 - 

[D] 10.6 通过 使 用 中 断 方式 检测 每 个 ASCII 码 字符 是 否 到 达 来 解决 习题 10.5 中 的 问题 。 

[D] 10.7 使 用 10.3 节 中 的 微 控 制 器 在 它 的 串 行 端口 上 接收 十 进 制 数 ， 每 个 数 由 四 个 ASCII 码 字符 的 数 
字 编 码 组 成 ， 为 了 区 分 连续 的 四 位 数字 的 数 ， 使 用 H 作为 定 界 符 。 这 样 ， 如 果 两 个 连续 的 数 
是 2143 和 6292， 那 么 接收 到 的 序列 将 是 H2143H6292。 每 个 数 将 被 显示 到 四 个 七 段 显示 器 单元 
上 。 假 设 每 个 显示 器 单元 有 一 个 BCD- 七 段 译 码 器 电路 与 其 相连 ， 如 图 P10-1 所 示 。 给 出 到 微 
控制 器 的 必要 连接 ， 写 一 个 程序 执行 所 需 完成 的 任务 。 使 用 图 10-8 中 的 串 行 接口 ， 并 使 用 轮 询 
方式 检测 每 个 ASCII 码 字 符 是 否 到 达 。 


BCD 数字 





图 P10-1 使 用 BCD 译 码 器 的 七 段 显 示 器 


[D] 10.8 通过 使 用 中 断 方式 检测 每 个 ASCII 码 字 符 是 否 到 达 来 解决 习题 10.7 中 的 问题 。 

[D] 10.9 重复 习题 10.7 中 的 问题 ， 但 假定 每 个 七 段 显示 器 单元 有 一 个 7 位 的 寄存 器 与 其 相连 ， 而 不 是 
BCD- 七 段 译 码 器 。 该 寄存 器 有 一 个 控制 输入 端 Load， 当 Load=1 时 ，7 个 数据 位 被 装 人 寄存 器 
中 。 寄 存 器 中 的 每 一 位 可 以 驱动 所 连接 的 显示 器 单元 的 一 个 段 。 图 P10-2 给 出 了 寄存 器 显示 器 
方案 。 排 列 微 控制 器 的 输出 连接 以 使 并 行 端口 A 为 所 有 的 四 个 显示 器 单元 提供 数据 。 





Load ( 装 入 ) 
图 P10-2 使 用 寄存 器 的 七 段 显 示 器 


[D] 10.10 通过 使 用 中 断 方式 检测 每 个 ASCII 码 字符 是 否 到 达 来 解决 习题 10.9 中 的 问题 。 
[E] 10.11 假定 被 测试 人 总 是 在 一 秒 之 内 做 出 响应 ， 修 改 10.4 节 中 的 反应 定时 器 。 这 样 ， 经 历 的 反应 时 


第 10 章 散 入 式 系统 : 273 


间 可 以 只 用 两 个 表示 百 分 之 一 秒 的 数字 显示 。 将 两 个 七 段 显示 器 单元 连接 到 端口 A 上 并 修改 
图 10-14 中 的 程序 来 实现 所 需要 的 操作 。 

[M] 10.12 在 图 10-13 中 ， 每 个 数字 的 七 段 显示 器 单元 都 包含 着 一 个 BCD- 七 段 译 码 回 ;因此 微 控制 器 为 
每 个 将 要 被 显示 的 数字 提供 一 个 4 位 BCD 码 。 假 设 不 使 用 译 码 器 ， 每 个 七 段 单元 有 一 个 带 有 
控制 输入 端 Load 的 7 位 寄存 器 ， 当 Load = 1 时 ，7 个 数据 位 被 装 人 寄存 器 中 。 寄 存 器 中 的 每 
一 位 驱动 所 连接 的 显示 器 单元 的 一 个 段 。 图 P10-2 给 出 了 寄存 器 显示 器 方案 。 修 改 图 10-14 中 
的 程序 使 其 能 够 适用 于 这 个 寄存 器 显示 器 电路 。 

[M] 10.13 使 用 10.3 节 中 的 微 控制 器 生成 一 个 “日 计时 ”时 钟 。 这 个 时 间 ( 小 时 和 分 钟 ) 将 被 显示 到 四 
个 七 段 显示 器 单元 上 。 假 定 每 个 显示 器 单元 有 一 个 BCD- 七 段 译 码 器 与 其 相连 ， 如 图 P10-1 所 
示 。 同 时 假设 使 用 一 个 100MHz 的 时 钟 。 给 出 所 需要 的 硬件 连接 并 写 出 相应 的 程序 。 

[M] 10.14 假定 每 个 七 段 显示 器 单元 有 一 个 寄存 器 与 其 相连 ， 如 图 P10-2 所 示 ， 重 复习 题 10.13 中 的 


问题 。 

[E] 10.15 在 一 个 用 单 芯 片 实现 的 系统 中 ， 处 理 器 和 主 存储 器 驻 留 在 同一 个 芯片 上 。 在 这 个 系统 中 是 否 需 
要 高 速 缓存 ? 请 解释 。 

参考 文献 


1. Test Access Port and Boundary-Scan Architecture, IEEE Standard 1149.1， May 1990. 


420 


421 


422 





第 11 章 | 


Computer Organization and Embedded Systems, Sixth Edition 


片上 系统 一 一 案例 研究 


本 章 目 标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

e 设计 一 个 可 在 FPGA 芯片 上 实现 的 系统 

e 使 用 CAD (计算 机 辅助 设计 ) 工具 

e 使 用 参数 化 模块 

e 典型 的 设计 要 求 

在 第 10 章 ， 我 们 讨论 了 艇 入 式 系统 中 微 控制 器 的 使 用 。 在 一 个 嵌入 式 应 用 中 ,我们 和 硕 
望 使 用 的 芯片 数量 尽 可 能 的 少 。 理 想 的 情况 是 用 单个 芯片 来 实现 整个 系统 。 术 语 片 上 系统 
(System-on-a-Chip，SOC ) 用 来 描述 该 技术 。 在 比较 简单 的 应 用 中 ， 用 那些 可 获得 的 商用 微 控 
制 器 可 以 实现 所 有 需要 的 功能 。 但 是 在 比较 复杂 的 应 用 中 就 不 太 可 能 了 。 

为 一 个 复杂 的 嵌入 式 应 用 设计 一 个 微 控 制 器 并 将 其 以 定制 芯片 的 形式 实现 不 仅 富 有 挑战 
性 ， 而 且 费 用 高 昂 。 同 时 ， 这 也 会 耗费 大 量 的 时 间 。 但 是 ， 大 部 分 消费 品 的 开发 时 间 又 必须 
要 尽量 短 。 如 果 设 计 者 可 以 利用 一 些 预 先 设计 的 易于 使 用 的 电路 模块 ,那么 对 于 一 个 给 定 的 
应 用 ， 实 现 其 整个 系统 的 芯片 就 可 以 在 较 短 的 时 间 内 开发 出 来 。 处 理 器 电路 就 是 所 需 的 模块 
之 一 。 这 种 电路 在 技术 文献 中 被 称 为 处 理 器 核 ( processor core )。 通 过 使 用 权限 许可 协议 ， 我 
们 可 以 从 多 家 企业 获得 各 种 处 理 器 核 。 同 时 也 可 以 获得 其 他 模块 来 实现 存储 器 、 输 入 /输出 接 
口 、 模 / 数 (AD ) 和 数 / 模 (D/A ) 转换 电路 或 DSP ( 数字 信和 号 处 理 ) 电路 。 然 后 系统 开发 者 
使 用 这 些 可 用 模块 并 设计 出 特定 应 用 所 需 电 路 的 剩余 部 分 ， 从 而 完成 设计 。 

处 理 器 核 和 其 他 模块 的 提供 商 是 在 销售 他 们 的 设计 而 不 是 芯片 。 他 们 将 知识 产权 
(intellectual property，IP ) 提供 给 其 他 人 使 用 ， 以 设计 他 们 自己 的 芯片 。 为 了 方便 基于 IP 产品 
的 开发 ， 可 以 使 用 各 种 计算 机 辅助 设计 (CAD ) 工具 。 

成 本 是 实现 一 个 定制 芯片 的 主要 因素 。 制 造 这 种 心 片 的 费用 很 高 ， 尽 管 它们 能 够 提供 更 
好 的 性 能 和 更 低 的 功 耗 ， 但 仅 当 需要 大 量 的 专用 芯片 时 ， 其 成 本 才 是 合理 的 。 一 种 可 能 的 替代 
方式 是 采用 现场 可 编程 门 阵列 ( FPGA ) 技术 。 





11.1 FPGA 的 实现 


FPGA 为 在 单个 芯片 上 实现 系统 提供 了 一 个 有 吸引 力 的 平台 。 它 不 像 市 面 上 销售 的 微 处 理 
器 芯片 那样 为 设计 者 提供 一 组 预先 定义 好 的 功能 单元 ，FPGA 器件 允许 设计 者 完全 自由 地 进行 
设计 。 设 计 者 可 以 使 用 合适 的 IP 模块， 然后 按照 需求 构造 系统 的 其 余部 分 。 这 可 以 相对 容易 
地 完成 。 一 旦 完成 设计 并 经 过 测试 ， 就 可 以 立即 将 其 在 FPGA 器 件 中 实现 。 

FPGA 的 功能 已 经 有 了 突飞猛进 的 增强 。 单 个 FPGA 芯片 可 以 实现 一 个 包含 数 十 万 个 逻辑 
门 的 系统 。 这 样 大 的 芯片 已 经 足以 实现 复杂 的 组 入 式 应 用 所 需要 的 微 控 制 嚣 和 其 他 电路 的 典型 
功能 。 

在 这 一 章 中 ,我们 将 研究 在 嵌入 式 环境 中 使 用 FPGA 所 涉及 的 问题 。 为 了 使 讨论 尽 可 能 
地 实用 ,我 们 将 考虑 Altera 公司 提供 的 技术 ， 该 公司 是 FPGA 器 件 的 主要 供应 商 之 一 ， 并 支持 
CAD 软件 。 
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11.1.1 FPGA 器 件 

附录 A 中 对 FPGA 的 基本 结构 进行 了 说 明 。FPGA 器 件 包 含 了 大 量 的 逻辑 元 件 以 及 用 于 
将 它们 互 连 的 通用 布线 资源 。 通 常 它 们 也 包含 相当 数量 的 存储 器 ， 当 存储 器 容量 需求 不 太 大 
时 可 以 用 这 些 存 储 器 来 实现 庶 入 式 系统 中 的 RAM 和 ROM 部 件 。 许多 FPGA 也 包含 乘法 器 电 
路 ， 该 电路 在 DSP 应 用 中 尤其 有 用 。 

我 们 必须 对 FPGA 器 件 进行 编程 以 实现 特定 的 设计 。 人 逻辑 元 件 包 含 了 可 编程 的 开关 ， 我 
们 必须 对 这 些 开关 进行 设置 以 实现 所 需 的 逻辑 功能 。 通 常情 况 下 ， 可 以 对 一 个 逻辑 元 件 进行 编 
程 以 实现 包含 四 到 六 个 变量 的 逻辑 丽 数 。 逻 辑 元 件 同时 也 包含 一 个 触发 器 ， 该 触发 器 使 得 寄存 
人 和 有 限 状态 机 的 实现 成 为 可 能 。 互 连 布线 也 包含 可 编程 的 开关 ， 这 些 开关 可 以 用 来 将 逻辑 元 
件 互 连 起 来 实现 所 需 的 电路 。 设 置 这 些 开关 的 编程 过 程 被 称 作 配 置 (configure ) FPGA 器 件 。 

在 大 多 数 的 FPGA 器 件 中 ， 每 个 可 编程 开关 的 状态 都 是 在 8.2.2 节 中 所 讨论 的 SRAM 单 
元 中 进行 设置 的 。 由 于 SRAM 单元 只 有 在 打开 FPGA 电源 的 情况 下 才能 保持 其 状态 ， 所 以 
这 种 FPGA 是 易 失 性 的 。 如 果 关 闭 电源 ， 我 们 必须 在 再 次 接 通电 源 时 重新 配置 该 器 件 。 为 了 
配置 FPGA， 必 须 将 配置 信息 装 入 器件 中 。 这 通常 是 使 用 另 一 个 叫做 配置 器 件 ( configuration 
device ) 的 芯片 来 完成 的 ， 该 器 件 将 所 需 的 信息 保存 在 闪存 类 型 的 存储 器 中 。 只 要 接 通 电源 ， 
配置 器 件 就 自动 对 FPGA 进行 编程 。 

通常 情况 下 ， 配 置 器 件 中 的 闪存 容量 很 大 ， 不 仅 可 以 容纳 在 FPGA 中 所 实现 电路 的 配置 
数据 ， 而 且 还 可 以 容纳 一 些 由 数据 或 代码 组 成 的 额外 信息 。 如 果 处 理 器 核 是 在 FPGA 中 实现 
的 ， 那 么 就 可 以 在 配置 器 件 中 存储 一 些 处 理 器 将 要 执行 的 代码 。 


11.1.2 ”处 理 器 的 选择 


任何 一 个 片上 系统 的 关键 部 件 是 处 理 器 核 。 基 于 FPGA 的 系统 存在 两 种 不 同 的 选择 。 其 
中 一 种 包含 一 个 处 理 器 ， 该 处 理 器 是 由 软件 定义 的 并 在 FPGA 中 以 与 其 他 电路 相同 的 方式 来 实 
现 的 。 另 一 种 则 包含 一 个 专用 的 FPGA 芯片 ， 其 处 理 器 核 是 在 制造 时 实现 在 芯片 上 的 。 

1， 软 处 理 器 核 

最 灵活 的 解决 方案 是 提供 一 个 用 硬件 描述 语言 ( 如 Verilog 或 者 VHDL ) 编写 的 软件 模块 ， 
该 模块 指定 了 一 个 参数 化 的 处 理 器 。 嵌 入 式 系 统 的 设计 者 可 以 设置 参数 使 得 处 理 器 拥有 目标 应 
用 所 需 的 合适 功能 。 例 如 ， 高 速 缓存 配置 有 一 个 参数 ， 其 可 能 的 选择 如 下 : 

e 没有 高 速 缓存 。 

e 有 指令 高 速 缓存 ， 但 没有 数据 高 速 缓存 。 

e 既 有 指令 高 速 缓存 又 有 数据 高 速 缓存 。 

另 一 个 参数 可 能 与 处 理 器 中 是 否 包 含 乘法 和 除法 电路 有 关 。 乘 法 和 除法 操作 可 以 用 硬件 
实现 ， 但 也 可 以 用 软件 方式 实现 。 以 硬件 方式 实现 乘法 和 除法 操作 会 使 用 更 多 的 FPGA 资源 ， 
但 这 也 大 大 地 提高 了 性 能 . 

2， 硬 处 理 器 核 

软 处 理 器 核 的 一 种 替代 方法 是 直接 在 芯片 上 以 硬件 模块 的 方式 实现 处 理 器 ， 这 样 就 可 以 
构造 一 个 专用 的 FPGA， 从 而 可 以 实现 更 高 性 能 的 系统 。 但 是 这 种 FPGA 的 成 本 要 高 于 普通 
FPGA 器 件 的 成 本 。 


11.2 ”计算 机 辅助 设计 工具 
FPGA 器 件 的 制造 商 提供 了 强大 的 CAD 工具 ， 这 使 得 嵌入 式 系统 的 设计 变 得 相对 简单 了 。 
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各 种 预先 定义 的 模块 都 以 参数 化 的 形式 提供 。 设 计 者 可 以 通过 包含 这 些 模块 并 指定 其 参数 来 构 
建 一 个 满足 应 用 要 求 的 系统 。 这 样 的 模块 有 : 

e 处 理 器 核 

。 存储 器 模块 及 其 接口 

。 并 行 IO 接口 

。 串 行 VO 接口 

。 定时 器 /计数 器 电路 

这 些 模 块 可 能 足以 实现 一 个 特定 的 嵌入 式 系统 所 需要 的 所 有 功能 。 如 果 还 不 够 ， 那么 我 
们 必须 设计 额外 的 专用 电路 并 将 其 包含 在 系统 中 。 

通常 情况 下 ， 我 们 会 首先 确定 一 个 包含 处 理 器 核 和 其 他 参数 化 模块 的 子 系统 。 使 用 CAD 
工具 可 以 生成 一 个 实现 该 子 系统 的 模块 。 该 模块 由 硬件 描述 语言 定义 。 然 后 在 总 体 设计 时 将 该 
模块 与 任何 已 创建 的 其 他 专用 电路 一 起 实例 化 。 最 后 ,我们 使 用 男 一 个 不 同 的 CAD 工具 来 合 
成 并 实现 总 体 设计 ， 该 设计 形式 可 用 于 配置 FPGA 器 件 。 

除了 FPGA 器 件 ， 还 需要 将 完成 系统 所 需要 的 外 部 组 件 也 包括 进来 ， 如 交换 机 、 显 示 器 
和 额外 的 存储 器 芯片 。 这 些 部 件 必须 连接 到 FPGA 的 适当 引 脚 上 。 我 们 将 在 11.3 节 的 设计 实 
例 中 讨论 这 些 问题 。 

为 了 向 读者 提供 一 个 CAD 工具 和 FPGA 器 件 模块 的 具体 例子 ， 我 们 将 简要 地 介绍 Altera 
公司 提供 的 工具 。 有 关 其 技术 和 工具 的 所 有 信息 都 可 以 在 Altera 公司 的 网 站 上 得 到 [1]。 


ALTERA 公司 的 CAD 工具 

Altera 公司 主要 的 CAD 工具 被 称 为 Quartus II 软件， 其 中 包括 了 在 FPGA 器 件 上 设计 并 实 
现 一 个 数字 系统 所 需 的 全 部 工具 。 其 中 有 一 个 工具 叫做 SOPC Builder， 可 以 用 来 设计 包含 一 个 
处 理 器 核 的 系统 。 该 工具 包括 了 可 用 于 所 设计 系统 的 多 个 参数 化 模块 。 为 了 说 明 它 们 的 特性 ， 
我 们 将 考虑 其 中 的 四 个 模块 。 

1. Nios ll 处 理 器 

附录 B 中 描述 了 Nios II 处 理 器 。 对 于 在 FPGA 中 的 实现 ， 它 提供 了 三 个 版 本 : 经 济 版 ， 
标准 版 和 快速 版 。 经 济 版 是 最 简单 的 且 实 现 起 来 花费 最 少 ( 从 使 用 FPGA 资源 的 角度 上 看 )， 
其 性 能 也 是 最 低 的 。 它 不 包含 任何 高 速 缓存 ， 是 非 流 水 线 的 ， 而 且 不 使 用 转移 预测 。 标 准 版 有 
着 较 好 的 性 能 ， 它 包括 一 个 指令 高 速 缓存 ， 是 流水 线 的 ， 并 且 使 用 静态 转移 预测 。 快 速 版 的 性 
能 是 最 好 的 ， 它 同时 包括 指令 高 速 缓存 和 数据 高 速 缓存 ， 并 且 使 用 动态 转移 预测 。 

设计 者 可 以 指定 多 个 参数 ， 包 括 指令 以 及 数据 高 速 缓存 的 大 小 。Nios II 处 理 器 核 很 小 ， 
它 只 占 FPGA 器 件 的 很 小 一 部 分 。 在 一 个 相对 小 的 FPGA 中 ， 有 可 能 可 以 实现 多 达 10 个 Nios 
I 核 。 

2. 存储 器 

FPGA 器 件 的 存储 块 可 用 于 实现 高 速 缓存 和 一 部 分 主 存 。 用 这 种 方式 实现 的 那 部 分 主 存 被 
称 为 片上 存储 器 ( on-chip memory )。 该 片上 存储 器 可 以 用 多 种 方式 对 其 进行 配置 。 它 可 以 被 实 
现 为 RAM 或 ROM 类 型 的 存储 器 - 在 设计 阶段 ,我们 可 以 指定 其 大 小 和 字 长 。 

如 果 片 上 存储 器 不 够 大 ， 无 法 容纳 散人 式 应 用 中 所 需 的 软件 ， 那 么 就 有 必要 通过 使 用 外 
部 存储 器 芯片 来 提供 额外 的 存储 空间 。 使 用 SOPC Builder 可 以 很 容易 地 生成 将 FPGA 上 的 系 
统 连接 到 各 种 外 部 存储 器 组 件 (如 SRAM、SDRAM 和 闪存 设备 ) 所 需 的 控制 器 和 接口 。 
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3， 并 行 |/O 接口 
并 行 接口 ， 被 称 为 PIO， 是 一 个 可 同时 用 于 输入 和 输出 的 参数 化 模块 。 在 设计 时 ， 我 们 可 
以 选择 其 数据 端口 将 其 用 作 
e 输入 端口 
e 输出 端口 
e 双向 端口 
如 果 选 择 了 双向 端口 选项 ,那么 PIO 数据 线 必须 与 具有 三 态 功 能 的 FPGA 引 脚 相 连 。 
地 址 偏 移 量 
(以 字 节 为 单位 ) (n -1) 0 


图 11-1 PIO 接口 中 的 寄存 器 


处 理 器 将 PIO 作为 一 个 存储 器 映射 接口 来 访问 ， 可 以 采用 第 3 章 中 描述 的 方式 与 其 进行 
通信 。 图 11-1 显示 了 PIO 中 的 寄存 器 。 寄 存 器 的 大 小 二 是 一 个 在 设计 阶段 指定 的 参数 ， 其 范 
围 在 1 到 32 之 间 。 这 些 寄存 器 的 使 用 如 下 : 
@ 数据 ( data ) 寄存 器 保 存 了 在 处 理 器 和 PIO 接口 之 间 传 输 的 n 位 数据 。 
e 在 实现 双向 端口 时 ， 方 向 ( direction ) 寄存 融 确 定 了 nn 条 数据 线 中 每 一 条 的 传输 方向 
( 输入 或 输出 )。 

e 中 断 屏 项 (interrupt-mask ) 寄存 器 用 于 激活 来 自 与 PIO 相连 的 输入 线 上 的 中 断 。 在 n 
条 输入 线 的 每 一 条 上 都 可 以 发 出 单独 的 中 断 请 求 。 

@ 边沿 捕获 (edge-capture ) 寄存 器 通过 检测 与 PIO 相连 的 输入 线 上 的 信和 号， 指示 其 中 逻 
辑 值 的 变化 。 所 检测 到 的 边沿 类 型 ( 上升 或 下 降 ) 将 在 设计 阶段 指定 。 

我 们 可 以 单独 配置 将 PIO 连接 至 一 个 IO 设备 的 每 条 线路 。 如 果 PIO 只 是 作为 一 个 输入 
端口 ， 那 么 在 设计 阶段 我 们 会 将 所 有 的 n 条 线路 都 配置 为 输入 。 类 似 地 ， 对 于 一 个 输出 端口 ， 
所 有 的 线路 都 被 配置 为 输出 。 在 这 些 情况 下 ， 方 向 寄存 器 是 不 需要 的 ， 同 时 它 也 不 会 在 最 终生 
成 的 电路 中 实现 。 对 于 一 个 双向 端口 ， 就 需要 方向 寄存 器 了 ; 当 其 第 上 位 的 值 等 于 1(0) 时 ， 
端口 的 第 上 条 线路 就 起 着 向 ( 从 ) 所 连接 的 VO 设备 输出 (输入 ) 信息 的 作用 。 

当 把 PIO 作为 一 个 输入 端口 使 用 时 ， 其 数据 寄存 器 包含 当前 输入 线 上 的 逻辑 值 。 通 过 使 
用 边沿 捕获 寄存 器 我 们 可 以 检测 输入 线 上 逻辑 值 的 变化 。 在 设计 时 ， 我 们 可 以 指定 : 当 输入 信 
号 出 现 一 个 边沿 的 时 候 将 该 寄存 器 中 的 位 设置 为 1。 该 边沿 可 以 被 指定 为 : 上 升 、 下 降 或 二 者 
均 可 。 通 过 一 条 程序 指令 将 0 写 信 寄存器， 就 可 以 将 边沿 捕获 寄存 器 中 的 位 清 零 。 

中 断 屏蔽 寄存 器 允许 激活 和 禁用 中 断 。 通 过 将 1 写 人 寄存 器 的 第 上 位 ， 就 可 以 激活 由 输入 
线 上 上 的 活动 引起 的 中 断 。 该 中 断 可 以 是 : 

e 电 平 敏感 的 ， 在 这 种 情况 下 ， 当 任意 一 条 被 激活 的 输入 线路 上 的 信和 号 值 是 1 的 时 候 ， 

就 会 发 出 中 断 请 求 。 
。 边沿 敏感 的 ， 在 这 种 情况 下 ， 当 边沿 捕获 寄存 器 中 任意 一 个 被 激活 的 位 的 值 等 于 1 的 
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时 候 ， 就 会 发 出 中 断 请 求 。 
注意 ， 不 论 长 度 n 是 多 少 ， 图 11-1 中 PIO 寄存 器 的 地 址 都 偏 移 4 个 字 节 。 这 样 ， 寄 存 器 
地 址 都 是 字 对 齐 的 。 
4， 间隔 定时 器 
定时 器 模块 的 功能 与 3.4 节 中 描述 的 定时 器 类 似 。 其 关键 部 件 是 一 个 计数 器 ， 计 数 器 的 内 
容 在 每 个 时 钟 周 期 中 减 1。 该 计数 器 可 以 被 指定 为 32 或 64 位 长 。 在 我 们 的 讨论 中 ,我们 将 假 
设计 数 器 是 32 位 的 。 间 隔 定时 器 接口 中 的 寄存 器 如 图 11-2 所 示 。 每 个 寄存 器 都 是 16 位 长 的 。 
在 状态 寄存 器 中 ， 只 使 用 了 2 位 : 
e 当 计 数 器 运行 的 时 候 ，RUN 等 于 1， 否则 就 等 于 0。 该 位 不 受 处 理 器 写 人 状态 寄存 器 操 


作 的 影响 。 
e TO 是 超时 位 。 它 在 计数 器 到 达 0 时 被 置 为 1。 并且 它 会 一 直 保 持 值 1 直到 处 理 器 通过 
写 和 人 0 将 其 清 零 。 
地 址 偏 移 量 
(以 字 节 为 单位 ) 15 4 3 2 


1 0 
[一 和 和 


图 11-2 间隔 定时 器 接口 中 的 寄存 器 


在 控制 寄存 器 中 ， 用 到 了 4 个 位 : 

e 通过 将 STOP 置 为 1 来 停止 计数 器 。 

` e@ 通过 将 START 置 为 1， 使 计数 器 开始 运行 。 

e@ 当 计数 器 到 达 0 时 ，CONT 决定 计数 器 此 时 的 行为 。 如 果 CONT=0， 计 数 器 会 在 它 到 

达 0 时 停止 运行 。 如 果 CONT=1， 则 计数 器 重新 装 入 初始 计数 值 并 继续 运行 。 

e ITO 被 置 为 1 时 允许 中 断 。 

初始 计数 值 必须 在 两 个 16 位 的 写 操作 内 装 和 人 寄存 器 中 。 计 数 器 快照 寄存 器 用 于 在 计数 器 运 
行 时 对 其 内 容 进 行 快 照 。 对 任意 一 个 快照 寄存 器 的 写 操作 都 会 导致 一 个 快照 操作 , ,也 就 是 说 计 
数 器 的 当前 内 容 会 被 装 人 快照 寄存 器 中 。 然 后 ， 我 们 就 可 以 用 通常 的 方式 去 读 取 这 些 寄存 器 。 

除了 可 以 使 用 初始 计数 值 来 定义 一 个 超时 周期 外 ， 我 们 也 可 以 在 设计 时 指定 一 个 默认 的 
超时 周期 。 当 初始 计数 值 为 零 的 时 候 ， 我 们 就 使 用 该 默认 的 超时 周期 。 

当 TO=1 时 会 发 出 一 个 中 断 请 求 并 将 ITO 置 为 1。 为 了 清除 该 请 求 ， 处 理 器 必须 向 TO 中 
写 入 0。 

在 下 一 节 中 ， 我们 将 在 一 个 完整 的 设计 示例 中 使 用 上 面 所 介绍 的 模块 。 


~ 
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11.3 ”闹钟 示例 

在 这 一 节 中 ， 我们 将 介绍 一 个 嵌入 式 系统 的 详细 示例 。 我 们 将 说 明 如 何 使 用 FPGA 技术 
来 实现 一 个 阅 钟 。 该 闹钟 ， 如 网 11-3 所 示 ， 具 有 以 下 的 要 求 : 

e 通过 四 个 七 段 显示 器 用 小 时 和 分 钟 来 显示 时 间 ; 

e 使 用 一 个 on/o 企 滑动 开关 来 启用 闹 铃 功能 ; 

e 使 用 两 个 滑动 开关 来 设置 实际 时 间 和 闸 铃 时 间 ; 

e 使 用 两 个 按键 开关 来 设置 小 时 和 分 钟 ; 

e 一 个 LED 灯 用 来 显示 闭 铃 已 被 设置 ; 

e 用 两 个 垂直 排列 的 LED 灯 ， 组 成 一 个 冒号 来 分 隔 小 时 和 分 钟 ; 

e 当 闸 铃 滑动 开关 被 激活 并 且 到 达 设 置 的 闸 铃 时 间 时 ， 发 出 喻 喻 的 声音 


11.3.1 ”系统 的 用 户 视图 


图 11-3 显示 了 用 户 所 看 到 的 闹钟 。 图 3-17 设置 。 设置 
所 描述 的 七 段 显 示 器 用 来 显示 时 间 。 时 间 的 显示 
范围 为 00:00 到 23:59。 该 时 钟 的 操作 如 下 : 
e 当 接 通电 源 时 ， 当 天 时 间 和 闹 铃 时 间 都 被 
清 为 0。 
e 当天 时 间 的 设置 方法 : 激活 “设置 实际 时 
间 (set-actual-time )” 的 滑动 开关 ， 然 后 图 11-3 ”闹钟 的 用 户 视 图 
通过 按 下 小 时 ( Hour ) 和 分 钟 ( Minute ) 按键 来 设置 时 间 。 每 按 一 次 按键 ， 显 示 的 时 
间 就 增加 1。 
e 在 激活 “设置 闹 铃 时 间 ( set-the-alarm-time )” 开 关 后 ， 用 同样 的 方式 设置 闹 铃 时 间 。 
e 通过 激活 “ 闵 铃 - 开 / 关 (alarm-on/off )” 开 关 来 开启 曾 铃 。 这 会 使 得 对 应 的 LED 灯 被 
点 亮 。 
e 在 启动 闸 铃 开关 的 情况 下 ,扬声器 会 在 到 达 曾 铃 时 间 时 发 出 喻 喻 声 


11.3.2 ”系统 的 定义 和 生成 


我 们 的 目标 是 利用 FPGA 心 片 以 及 包括 滑动 开关 、 按 键 开 关 、 七 段 显 示 器 、LED 灯 和 扬 
声 器 在 内 的 外 部 组 件 来 实现 闹钟 。 图 11-4 描述 了 所 需 的 系统 ， 其 中 的 处 理 器 是 Nios II 处 理 器 。 
即便 是 在 一 个 很 小 的 FPGA 芯片 上 ， 其 片上 存储 器 的 容量 也 足以 满足 我 们 应 用 的 需要 。 我 们 
通过 PIO 接口 来 连接 外 部 组 件 。 系 统 包 含 两 个 定时 器 ， 其 中 一 个 旨 在 提供 一 分 钟 的 时 间 间 隔 ， 
用 于 更 新 一 天 的 时 间 。 男 一 个 则 用 于 生成 方 波 来 产生 喻 喻 声 。 通 过 使 用 11.2.1 节 中 描述 的 间隔 
定时 器 模块 ， 就 可 以 实现 定时 器。 我 们 将 假设 滑动 开关 被 激活 时 会 产生 一 个 逻辑 信号 1。 按 键 
开关 是 防 反 弹 的 ， 当 它们 被 按 下 时 会 产生 一 个 逻辑 信号 0。 
该 系统 是 通过 使 用 Quartus II 软件 在 FPGA 器 件 中 实现 的 。SOPC Builder 用 来 实现 图 11-4 
中 阴影 区 域 的 块 。 其 中 PIO 块 的 配置 如 下 : 
e PIO1 是 一 个 3 位 宽 的 输入 端口 。 它 的 数据 输入 是 电 平 敏感 的 。 
e PIO2 是 一 个 2 位 宽 的 输入 端口 。 它 的 输入 是 下 降 沿 敏感 的 ， 这 样 当 相应 的 按键 被 按 下 
时 ,边沿 捕获 寄存 器 的 一 位 就 会 被 置 为 1。 
e PIO3 是 一 个 32 位 宽 的 输出 端口 。 它 的 每 一 个 字 节 都 与 一 个 七 段 显示 器 相连 ， 每 个 字 
节 的 0 到 6 位 中 的 每 一 位 用 来 驱动 七 段 显 示 器 的 一 段 ， 而 不 使 用 第 7 位 。 低 字 节 将 与 “” [到 9 


闹 铃 


小 时 ”分钟 实际 时 间 闹 铃 时 间 开 / 关 
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显示 器 上 显示 分 钟 的 低位 数字 相连 ， 而 高 字 
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e。 PIO4 是 一 个 3 位 宽 的 输出 端口 。 
。PIO5 是 一 个 1 位 宽 的 输出 端口 。 


[一 - 





通过 使 用 SOPC Builder， 该 


同 的 地 址 。 还 要 注意 的 是 定时 器 和 按键 开关 可 以 发 出 中 断 请 求 人 





节 则 与 显示 小 时 的 高 位 数字 相连 。 





片上 存储 器 


图 11-4 





闲 钟 的 框图 


系统 被 指定 为 如 图 11-5 所 描述 的 那样 。 注 意 ，PIO 的 名 称 表 
示 了 它们 的 功能 。SOPC Builder 为 系统 中 的 各 种 组 件 分 配 地 址 。 片 上 存储 器 占用 的 地 址 范围 是 
0 到 0x3FFF， 而 定时 器 和 PIO 接口 的 起 始 地 址 为 0x5000。 如 果 需 要 的 话 设计 者 也 可 以 指定 不 


分 钟 定时 器 


FPGA 芯片 





音调 定时 器 





IRQ )。 图 中 的 最 后 一 列 给 出 


了 Nios I 控制 寄存 器 ctl3 和 ctl4 中 与 这 些 中 断 源 的 中 断 相 关 的 位 。SOPC Builder 通过 产生 一 
个 用 Verilog 或 VHDL 硬件 描述 语言 描述 系统 的 模块 生成 指定 的 系统 。 


.Conn... h 
日 cpu 


instruction _master 


data_master 


jag_debug_module 
日 onchip_ memory 


s1 
日 minute timer 
JS1] 
日 tone _ timer 
s1 
日 sliders 
SA 
日 pushbuttons 
s1 
”| 加 display 
31 
日 LEDs 
人 s1 
| 日 speaker 
s1 





Module Name - 1 


| _Description 


|Nios i Processor 

Avalon hemory NMapped Master 
Avalon Memory Napped Master 
avalon NMemory Maphed Slave 
On-Chip Memory (RAM or RON) 
Avalon Memory Mapped Slave 
Interyal Timer 

Avalon Memory Mapped Slave 
Interval Timer 

Avalon Memory Mapped Slave 
PIC (parallel liO) 

Avalon MemorY Mapped Slave 
PID (Parallel liO) 

Avalon Memory Mapped Slave 
PIO (Paraliel IO) 

Avalon Memory Mapped Slave 
PIO (Parallel lo) 

Axvalon Memory Mapped Slave 
plo (Parallsl LO) 

Avalon Nlemary Napped Slave 





Glock 


clk 


clk 


clk 


clk 


clk 


cIk 


CIK 





clk 


cik 





准 


Be 


IRQ DO 


Ox00004300 


0x00000000 


a 0x00005000 


02x00005020 


0Dx00005030 


0x00005050 


Ox00005060 


0x00005070 


0x00005080 


图 11-5 使 用 SOPC Builder 设计 的 FPGA 片上 系统 


| 





| End 


IRQ 31 
Ox00004ffE 


DxD0003EEE 


10x0000501f 


Ox0000503£ 
Ox0000504£ 
Dx000050S5f£ 
0xpboognkt 
Ox0000507£ 


Dx0000508f 
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11.3.3 ”电路 实现 

Quartus I 软件 包括 一 个 编译 器 ， 该 编译 器 可 以 接受 用 硬件 描述 语言 描述 的 数字 系统 规范 。 
它 合 成 实现 系统 的 电路 ， 并 确定 如 何在 FPGA 发 片 上 实现 该 电路 。 

由 于 外 部 设备 必须 连接 到 FPGA 的 引 脚 上 ， 设 计 者 必须 指定 所 需 的 连接 。 这 被 称 为 引 脚 
分 配 ( pin assignment )。 编 译 占 会 以 一 个 配置 文件 的 形式 生成 最 终 的 实现 结果 ， 这 个 配置 文件 
用 于 将 配置 信息 下 载 到 FPGA 器 件 中 。 

图 11-4 并 没有 给 出 实现 完整 闹钟 所 需要 的 所 有 部 件 。 缺 少 的 部 件 有 : 电源 ， 时 钟 信号 
发 生 需 以 及 对 FPGA 进行 编程 的 配置 设备 。 我 们 将 假设 使 用 一 个 100MHz 的 外 部 时 钟 信 和 号 。 
FPGA 的 引 脚 通常 是 不 能 直接 连接 到 如 开关 、 七 段 显 示 器 和 LED 等 外 部 设备 上 的 。 每 个 设备 
都 有 它 自己 的 电气 特性 ， 这 通常 意味 着 我 们 必须 使 用 电阻 等 元 件 ， 如 图 10-13 所 示 。 

在 我 们 的 设计 中 ， 设 置 小 时 和 分 钟 的 按键 分 别 与 相应 PIO 的 b1 和 bo 位 相连 。 滑 动 开 
关 “ 设 置 实际 时 间 ”( set-actual-time )、“ 设 置 闹 铃 时 间 ”( set-alarm-time ) 和 “ 疝 铃 ~ 开 / 关 ?” 
( alarm-on/off ) 分 别 与 相应 PIO 的 b,、b! 和 bo 位 相连 。 分 钟 定时 器 的 超时 周期 为 60 秒 ， 而 音 
调 定时 器 的 超时 周期 则 为 1 毫秒 。 


11.3.4 ”应 用 软件 

为 了 实现 曾 钟 的 功能 ， 我 们 有 必要 写 一 段 程序 使 其 在 设计 的 硬件 上 运行 。 我 们 将 给 出 两 
个 程序 : 一 个 用 C 语 言 编 写 ， 另 一 个 用 Nios II 汇编 语言 编写 。 通 过 这 两 个 程序 来 说 明 如 何 编 
写 这 样 的 程序 。 编 写 好 的 程序 必须 被 编译 成 Nios I 机 器 代码 。 通 电 时 ， 要 将 该 代码 从 配 园 设 
备 装 和 人 片上 存储 器 中 。 

我 们 使 用 下 面 的 方法 来 编写 程序 。 实 际 时 间 和 闹 铃 时 间 保 存 为 32 位 的 二 进 制 整数 ， 以 
分 钟 的 形式 来 表示 时 间 。 每 当 分 钟 定 时 器 达到 0 的 时 候 ， 实 际 时 间 就 会 增加 1， 并 通过 将 状 
态 寄 存 器 中 的 TO 位 置 为 1 对 其 进行 显示 。 当 实际 时 间 增 加 的 时 候 ， 需 要 检查 它 是 否 已 达到 
了 1440， 该 值 是 一 天 的 分 钟 数 。 如 果 已 达到 1440， 就 必须 将 时 间 清 为 0， 这 就 相当 于 时 间 从 
23:59 变 成 了 00:00。 在 按 下 按键 设置 时 间 的 时 候 也 需要 进行 类 似 的 检测 。 

为 了 显示 时 间 ， 在 计算 表示 小 时 和 分 钟 的 四 个 十 进 制 数字 的 时 候 ， 将 时 间 除 以 600， 这 样 
可 以 得 到 高 位 的 小 时 数字 ， 然 后 再 将 余数 除 以 60 得 到 低位 的 小 时 数字 ， 等 等 。 我 们 还 会 使 用 
一 张 表 来 查找 被 发 送 到 七 段 显示 器 的 相应 的 段 模式 。 

我 们 使 用 音调 定时 器 来 生成 一 个 500Hz 的 方 波 信号 ， 当 将 其 连接 到 一 个 扬声器 时 ， 便 会 
产生 喻 喻 声 。 音 调 定 时 器 在 连续 模式 下 运行 。 由 于 它 的 预定 义 超时 周期 为 Ims， 所 以 我 们 可 以 
通过 将 每 个 定时 器 周期 结束 时 的 信号 敢 辑 值 反 转 过 来 直接 产生 500Hz 的 信号 。 然 而， 为 了 说 
明 如 何在 一 个 应 用 程序 中 定义 不 同 的 周期 ， 我 们 将 使 用 初始 计数 寄存 器 来 指定 所 需 的 周期 。 在 
这 种 情况 下 ， 如 果 计 数 器 是 由 一 个 100MHz 的 时 钟 驱动 的 ， 那 么 产生 500Hz 的 信和 号 就 需要 值 
0x30D40。 

在 对 定时 器 的 超时 进行 轮 询 时 ， 需 要 检查 其 状态 寄存 器 的 TO 位 。 由 于 计数 器 在 运行 的 时 
候 RUN 位 始终 等 于 1， 所 以 可 以 通过 检查 状态 寄存 器 的 内 容 是 否 等 于 3 来 执行 轮 询 任务 。 由 
于 RUN 位 的 状态 并 不 会 受到 写 操作 的 影响 ， 所 以 我 们 只 需 通过 对 状态 寄存 器 写 0 就 可 以 将 
TO 位 清 为 0。 

1. C 程序 

图 11-6 给 出 了 一 个 可 能 的 C 语 言 程序 。 由 于 从 性 能 的 角度 来 看 ， 我 们 的 应 用 并 没有 什么 
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要 求 ， 因 此 我 们 使 用 轮 询 法 来 访问 每 一 个 PIO 和 定时 器 。 程 序 中 的 注释 用 于 解释 各 个 语句 的 


含义 。 我 们 观察 到 ， 
地 增加 。 


#define 
#define 
#define 
#define 
#define 
#define 
#define 
#define 
int 


/* 


宏 ADJUST 定义 了 一 个 表达 式 ， 这 使 得 时 间 在 不 同情 况 下 都 可 以 被 正确 


minute_timer (volatile int *) Ox5000 

tone_timer (volatile int *) Ox5020 

sliders (volatile int *) Ox5040 

pushbuttons (volatile int *) Ox5050 

display (int *) Ox5060 

LEDs (int *) Ox5070 

speaker (int *) Ox5080 

ADJUST!(t, x) ((t + x) > = 1440) ? (t+ x — 1440): (t+x) 
actual_time, alarm_time, alarm_active, time; 


十 六 进 制 到 7 段 的 转换 表 */ 


unsigned char table[16] = {0x40, Ox79, Ox24, Ox30, 0x19, Ox12, Ox02, Ox78, 


Ox00, Ox18, Ox3F, Ox3F, Ox3F, Ox3F, Ox3F, Ox3F}; 


void initializeToneTimer() 


{ 


} 


*(tone_timer + 2) = 0x0D40: ”/* 为 连续 的 操作 */ 
*(tone_timer + 3) = Ox03; 人 # 设置 超时 周期 */ 
*(tone_timer + 1) = 0x6; /+* 在 连续 模式 下 开始 */ 


void DISP(time) /# 获取 显示 器 的 7 段 模式 */ 


{ 


} 


*display = table[time / 600] << 24 | 
table[(time % 600)/ 60] << 16 | 
table[(time % 60)110] << 8| 
table[(time % 10)]; 


main() 


{ 





actual_time = alarm_time = alarm_active = 0; 
initializeToneTimer(); 
*(minute_timer + 1) = 0x6; 。 ”/* 在 连续 模式 下 运行 要 
while (1) 
{ 

if (*minute_timer == 3) 人 # 过 去 1 分 钟 #/ 

{ 


*minute_timer = 0; /# 将 TO 位 清 0*/ 
actual_time =ADJUST(actual_time, 1); 
} 


if ((*sliders & 1) != 0) 人 # 检 测 “ 益 铃 - 开 ”( alarm-on ) 开关 */ 
*LEDs = 7; 人/# 打开 闹 铃 LED 灯 */ 
if (actual_time == alarm_time) 
alarm_active = 1; /# 启动 闹 铃 铃声 */ 
else 
alarm_active = alarm_active & (*sliders & 1); 
if (*tone_timer == 3) /* 生成 方 波 */ 
{ 
*speaker = (*speaker ^ 1) & alarm_active; 
*tone_timer = 0: /# 将 TO 位 清 0*/ 
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*LEDs = 6; /# 关闭 六 铃 LED 灯 */ 


alarm _ active = 0; 


} 
if ((*sliders & 4) != 0) 让 检测 “设置 当天 时 间 ( set-the-time-of-day )” 开 关 */ 
{ 


DISP(actual_time): /* 显示 当天 的 时 间 */ 

if((*(pushbuttons + 3)&1)!=0) /* 设置 分 钟 ?*/ 
actual_time = ADJUST(actual_time, 1); 

else if ((*(pushbuttons + 3) 多 2)!=0) /* 设置 小 时 ? */ 
actual_time = ADJUST(actual_time, 60); 

*(pushbuttons + 3) = 0; ” 代 将 边沿 捕获 寄存 器 清 0*/ 


} 
else if ((*sliders & 2) != 0) 启 检 测 “ 设 置 阐 铃 时 间 ”( set-the-alarm-time ) 开关 */ 
{ 
DISP(alarm_time); /* 显示 羡 铃 时 间 */ 
if((*(pushbuttons +3) & 1)!=0) /* 设置 分 钟 ?*/ 
alarm_time = ADJUST(alarm_time, 1); 
else if ((*(pushbuttons + 3) & 2) !=0) /* 设置 小 时 ? */ 
alarm_time = ADJUST(alarm_time, 60); 
*(pushbuttons + 3) = 0; ”/* 将 边沿 捕获 寄存 器 清 0*/ 


DISP(actual_time); /* 显示 当天 的 时 间 */ 





图 11-6 ( 续 ) 


2.， 汇编 语言 程序 

图 11-7 给 出 了 一 个 Nios I 程序。 为 了 说 明 中 断 的 使 用 ， 该 程序 使 用 中 断 来 处 理 分 钟 定时 
器 ， 音 调 定时 器 则 使 用 轮 询 法 。 

在 设计 阶段 ， 当 处 理 器 接受 一 个 中 断 请 求 时 ，SOPC Builder 分 配 0x20 作为 中 断 处 理 程序 
的 起 始 地 址 。 中 断 处 理 程序 证 实 了 由 Nios I 处 理 器 的 外 部 设备 引起 的 中 断 已 经 发 生 ， 并 根据 
情况 调整 返回 地 址 (Nios I 中断 机 制 的 详细 说 明 参 见 附录 B )。 然 后 ， 它 将 分 钟 定 时 器 的 TO 
位 清 0 并 调用 中 断 服务 程序 。 注 意 ， 中 断 处 理 程 序 会 保存 寄存 器 r2 和 ra 的 内 容 ， 并 在 之 后 恢 
复 。 因 为 ra 是 在 调用 子 程序 时 保存 返回 地 址 的 链接 寄存 器 ， 当 程序 中 的 某 个 子 程序 在 执行 时 
可 能 会 发 生 定时 器 中 断 ， 所 以 中 断 处 理 程序 会 保存 ra 的 内 容 。 中 断 处 理 程序 还 会 使 用 寄存 器 
ra 来 调用 中 断 服 务 程序 UPDATE_TIME ， 该 程序 负责 增加 实际 时 间 并 在 午夜 的 时 候 将 所 存储 的 
时 间 清 为 0。 

主 程序 开始 时 先 创建 处 理 器 堆栈 并 清除 存储 时 间 的 存储 单元 。 在 初始 化 过 程 中 ， 它 也 会 
设置 音调 定时 器 的 超时 周期 。 接 着 它 会 启动 两 个 定时 器 并 人 允许 来 自分 钟 定 时 器 的 中 断 。 

主 循环 LOOP 负责 检查 滑动 开关 的 状态 并 采取 必要 的 动作 。 子 程序 DISP 则 负责 在 七 段 显 
示 器 上 显示 实际 时 间或 闹 铃 时 间 ， 这 两 个 时 间 分 别 保存 在 存储 单元 0x1000 和 0x1010 中 。 当 相 
应 的 按键 被 按 下 时 ， 子 程序 SETSUB 用 来 对 分 钟 和 小 时 的 值 进行 设置 。 每 次 按 下 按键 时 ， 相 
应 的 值 被 增加 1。 

程序 最 后 的 那 张 表 用 来 将 十 进 制 数字 转换 成 相应 的 七 位 模式 以 便 显示 。 

程序 中 的 注释 解释 了 各 个 语句 的 含义 。 控 制 寄 存 器 ctl3 和 ctl4 也 可 以 分 别 用 名 称 ienable 
和 ipending 来 对 其 进行 引用 。 我 们 会 在 程序 中 使 用 这 些 名 称 - 
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.equ 
.equ 
.equ 
.cdUu 
.edu 
.edu 
.equ 
.equ 
.equ 
.equ 
_Start: br 


/* 中 断 处 理 程 序 */ 
.Org Ox20 
subi sp, sp, 8 
stw r2, 0(Sp) 
stw ra, 4(sp) 
rdctl et, ipending 
beq et, r0, MAIN 


tone_timer, Ox5020 
sliders, Ox5040 
pushbuttons, 0x5050 
display, Ox5060 
LEDSs, 0x5070 
speaker, Ox5080 


STACK, 0x2000 
MAIN 


subi ea, ea, 4 


r2, minute_timer 
r0, (r2) 
UPDATE_TIME 
r2, 0(sp) 

ra, 4(sp) 

sp, sp, 8 


movia 
sthio 
call 
ldw 
ldw 
addi 
eret 


/# 主 程序 */ 

MAIN: movia 
movia 
stw 
movia 
stw 
movia 
movia 
movia 
movia 


sp, STACK 

r2, ALARM_TIME 
r0, (r2) 

r2, ACTUAL_TIME 
r0, (r2) 

r2, sliders 

r3, LEDs 

r4, display 

r5, pushbuttons 
movi  r6,6 

stbio r6, (r3) 

movia  r6, tone_timer 
ori r7, 0, Ox0D40 
sthio r7, 8(r6) 

ornl 17, r0, Ox03 
sthio r7, 12(r6) 

movi i7,6 

sthio r7, 4(r6) 

movia 16, minute_timer 
addi r7, 170,7 

sthio I7, 4(r6) 

movi 17,1 

wrcetl ienable, 17 

wrctl status, r7 

movia 


call DISP 
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minute_timer, Ox05000 


r10, ACTUAL_TIME 


ACTUAL _TIME, 0x1000 
ALARM_TIME, 0x1010 


六 保存 寄存 器 */ 


A* 如 果 不 是 外 部 中 断 ， 则 出 错 ，*/ 


入 将 其 看 作为 复位 
+ 递减 ea， 在 返回 主 程序 时 执行 */ 
入 被 中 断 的 指令 */ 


作 将 分 钟 定时 器 中 的 TO 位 清 0*#/ 
上 # 调 用 中 断 服务 程序 恢复 寄存 器 */ 


上 庆 设 置 堆栈 指针 */ 
上 # 将 症 铃 时 间 缓 冲 区 清 0*/ 


庆 将 实际 时 间 缓 冲 区 清 0*/ 


/# 滑动 开关 的 地 址 */ 

/#LED 的 地 址 */ 

/#* 了 段 显示 器 的 地 址 */ 

居 按 键 的 地 址 */ 

让 打开 两 个 垂直 的 LED 灯 */ 


此 设置 音调 定时 器 周期 */ 


/# 启 动 音调 定时 器 */ 


人 # 分 钟 定时 器 的 地 址 #/ 
人 # 启 动 定 时 器 */ 


/人 允许 定时 器 中 断 */ 
此 允许 外 部 中 断 */ 
此 显示 当天 的 时 间 */ 
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ldbio IT7, (r2) 
andi rll,r7,1 /#* 检查 闹 铃 开关 是 否 打开 */ 

beq rll, 0, NEXT 

movi rll,7 A* 如 果 是 ， 则 打开 闭 铃 LED 灯 */ 
stbio rll, (r3) 

movia m9,ALARM_ TIME 











ldw rll, (r9) 上 # 将 闹 铃 时 间 与 实际 时 间 进 行 比较 */ 
ldw r12, (r10) 
bne rll, r12, NEXT /# 疗 钟 需要 响 铃 则 ? */ 






movia  Tr8, tone_timer 
movi i121 

















RING_LOOP: 
call DISP 
ldbio r7, (T2) 
andi rl13,77,1 人 # 检查 六 铃 开关 是 否 打开 */ 
beq rl3,r0,NEXT 
ldhio 719,(r8) 必 读 取 音调 定时 器 的 状态 */ 
sthio 。 r0, (r8) 上 * 将 TO 位 清 0*/ 
andi 719,79,1 片 检查 计数 器 是 否 到 达 0*/ 
xor rl2, r9, r12 /# 生成 下 一 个 方 波 半 周 期 */ 
movia rll, speaker 
stbio rl2, (r11) 上 # 将 信号 发 送 给 扬声器 */ 
br RING_LOOP 

NEXT: movi rll,6 上 语 关 闭 “ 亲 铃 - 开 ”LED 指示 灯 */ 






stbio rll, (r3) 
TEST_SLIDERS: 
ldbio r7, (T2) 















andi rll,r7,2 /+“ 设 置 闹 铃 ”开关 是 否 是 打开 的 */ 
beq rll, r0, SETACT 此 如 果 不 是 ， 检 查实 际 时 间 */ 
movia rl0,ALARM_TIME ”/# 设置 闹 铃 时 间 */ 
br SET_TIME 

SETACT: 
andi rll,r7,4 /#“ 设 置 时 间 ” 开 关 是 否 是 打开 的 */ 
beq rll, r0, LOOP /# 所 有 的 滑动 开关 都 是 关闭 的 */ 
movia rl0,ACTUAL TIME 

SET_TIME: 
call DISP 
call SETSUB 
br TEST_SLIDERS 









/* 在 7 段 显示 器 上 显示 时 间 */ 
DISP: subi sp, sp, 24 人 # 保 存 寄存 器 */ 

Stw rll, 0(sp) 

stw rl12, 4(Sp) 

stw r13, 8(sp) 

stw r14, 12(sp) 

stw rl5, 16(sp) 

stw r16, 20(sp) 




















ldw rll, (r10) 族 加 载 将 要 显示 的 时 间 */ 

movi rl2,600 此 除 以 600， 确定 小 时 的 第 一 位 数字 */ 

divu rl3,r1l1, r12 

ldb r15, TABLE(r13) /* 获 取 7 段 模式 */ 

slli rl15, r15, 8 上 访 为 下 一 个 数字 腾 出 空间 */ 

mul r14, r13, r12 族 计 算 除 法 操作 的 余数 */ 

sub rll,rll,rl4 

movi rl2,60 此 将 余数 除 以 60， 得 到 小 时 的 第 二 位 数字 */ 






divu rl13, rll, rl12 
ldb r16, TABLE(r13) 人 # 获 取 7 段 模式 ， 将 其 与 第 一 位 数字 */ 
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or 
slli 
mul 
sub 
movi 
divu 
ldb 
or 
slli 
mul 
sub 
ldb 
or 
movia 
stw 
ldw 
ldw 
ldw 
ldw 
ldw 
ldw 
addi 
ret 


rl5, rl5, rl6 
rl15, rl5, 8 
rl14, rl13, r12 
rll, rll, rl4 
rl2, 10 

rl13, 711,rl2 
r16, TABLE(r13) 
rl5, rl5, r16 
rl5, rl5, 8 
rl14, r13, r12 
rll, rll, ri4 
r16, TABLE(r11) 
rl5, rl5, r16 
rll, display 
rl15, (r11) 
rll, O(sp) 
rl12, 4(sp) 
rl13, 8(sp) 
rl14, 12(sp) 
rl5, 16(sp) 
r16, 20(sp) 
sp, sp, 24 


/* 设置 所 需 的 时 间 */ 


SETSUB: 
subi 
stw 
Stw 
stw 
stw 
ldbio 
stbio 
andi 
beq 
ldw 
movi 
divu 
mul 
sub 
addi 
blt 
mov 
add 
stw 
br 
andi 
beq 
ldw 
addi 
movi 
blt 
sub 
stw 


ldw 
ldw 
ldw 


sp, sp, 16 

rll, O(sp) 

r12, 4(sp) 

r13, 8(sp) 

rl4, 12(sp) 
T1212(73) 

r0, 12(r5) 

rl13, r12, 1 

rl3, r0, HOURS 
rll, (r10) 

rl2, 60 
rl3,Trll,rl2 
rl4, rl3, r12 
rll,rll,rl4 

9 | 

rll, r12, SAVEM 
rll, ro 

rll, rl4,r1l1 
rll, (r10) 
DONE 

rl13, r12, 2 

rl3, r0, DONE 
rll, (r10) 

rl12, rl1, 60 
rl3, 1440 

r12, r13, SAVEH 
r12, r12, r13 
r12, (r10) 


rll, O(sp) 
r12, 4(sp) 
rl13, 8(sp) 


/* 拼接 起 来 ， 并 移 位 */ 
/#* 确定 要 显示 的 分 钟 */ 
此 除 以 10， 确 定 分 钟 的 第 一 位 数字 */ 


/# 获 取 7 段 模式 ， 将 其 与 前 两 位 数字 */ 
旋 拼 接 起 来 ， 并 移 位 */ 


片 计算 余数 ， 它 是 最 后 一 位 数字 */ 
此 将 最 后 一 位 数字 与 前 3 位 数字 拼接 起 来 */ 


上 访 显 示 所 得 到 的 模式 */ 
六 恢复 寄存 器 */ 


上 # 保 存 寄存 器 */ 


人 # 检查 按键 */ 

上 # 将 边沿 检测 寄存 器 清 0*/ 
/# 分 钟 按键 是 否 被 按 下 */ 
# 如 果 没 有 ， 检 查 小 时 */ 
/# 加 载 当 前 时 间 */ 

此 除 以 60， 确 定 小 时 数 */ 


族 除法 操作 的 余数 是 分 钟 数 */ 


谨 增 加 分 钟 */ 
必 如果 小 于 60 就 保存 ， 否 则 将 分 钟 设置 为 00*/ 


A#*( 小 时 x 60 ) + 更 新 后 的 分 钟 */ 
久保 存 新 的 时 间 */ 


/* 小 时 按键 是 否 被 按 下 ? */ 

/# 如果 没 有 ， 则 返回 */ 

/#* 加 载 当前 时 间 ( 以 分 钟 为 单位 )*/ 
此 加 上 60 分 钟 */ 

/#* 检查 更 新 后 的 时 间 是 否 小 于 24:00*/ 


上 六 将 小 时 滚动 到 00*/ 
上 证 保存 新 的 时 间 */ 


人 # 恢 复 寄 存 器 */ 
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ldw rl14, 12(sp) 
addi sp, sp, 16 
ret 


/* 更 新 实际 时 间 的 中 断 服务 程序 */ 


UPDATE_TIME: 
sp, sp, 12 人 # 保 存 寄存 器 */ 
r2, O(sp) 
r3, 4(sp) 
r4, 8(sp) 
r2, ACTUAL,_TIME 
r3, (r2) /# 加 载 一 天 的 当前 时 间 */ 
r3, r3, 1 /# 增 加 1 分 钟 */ 
r4, 1440 /* 如 果 更 新 后 的 时 间 小 于 24:00， 则 完成 */ 
r3, r4, SAVET 
r3, r0 /#* 否则， 设置 为 00:00*/ 
r3, (r2) 上 保存 更 新 后 的 时 间 */ 
r2, 0(sp) 上 * 恢复 寄存 器 */ 
r3, 4(sp) 
r4, 8(sp) 
sp, sp, 12 


/* 十 六 进 制 数 到 7 段 的 转换 表 */ 
.Org Ox1050 

TABLE: .byte Ox40, Ox79, Ox24, Ox30, Ox19, Ox12, Ox02, Ox78 
-byte Ox00, 0x18, 0x3F, 0x3F, Ox3F, Ox3F, Ox3F, Ox3F 
.end 
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11.4 ”结束 语 

嵌 人 式 系统 的 设计 者 不 可 避免 地 会 去 寻求 最 简单 和 性 价 比 最 高 的 方法 。 当 一 个 微 控 制 器 
芯片 拥有 实现 整个 系统 的 所 有 资源 时 ， 它 可 能 是 最 好 的 选择 。 但 是 如 果 需 要 额外 的 芯片 来 实现 
系统 ， 那 么 情况 就 不 同 了 。 此 时 ，FPGA 的 解决 方案 是 非常 有 吸引 力 的 ， 因 为 它们 倾向 于 使 用 
更 少 的 芯片 来 实现 系统 。 

另 一 个 考虑 是 可 使 用 预先 设计 的 模块 。 一 个 微 控制 器 芯片 包括 了 许多 不 同 的 模块 。 如 果 
有 任何 的 功能 无 法 用 这 些 模块 实现 ， 那 么 就 必须 使 用 额外 的 芯片 来 实现 。FPGA 器 件 可 使 设计 
者 设计 任何 类 型 的 数字 电路 。 使 用 现代 FPGA 器 件 可 以 实现 非常 庞大 和 复杂 的 电路 。 

实际 的 设计 往往 涉及 执行 常用 任务 的 电路 。 这 些 电 路 通常 可 作为 库 模 块 使 用 ， 正 如 我 们 
在 上 一 节 中 使 用 的 VO 接口 和 定时 器 电路 所 示 的 那样 。 对 于 信号 处 理应 用 来 说 ， 库 中 包含 了 典 
型 的 滤波 电路 。 当 一 个 系统 要 通过 一 个 标准 的 互 连 方案 ( 如 PCI Express ) 连接 到 另 一 台 计算 
机 上 时 ， 如 果 PCI Express 接口 可 作为 预先 设计 的 模块 使 用 ， 那 么 设计 者 的 任务 就 会 变 得 简单 
得 多 。 


习题 

[E] 11.1 在 11.3.4 节 中 ， 我 们 提 到 可 以 通过 简单 地 将 音调 定时 器 每 个 超时 周期 结束 时 的 信和 号 逻辑 值 反 转 
过 来 产生 500Hz 的 方 波 信号 ， 其 中 该 定时 器 的 超时 周期 被 设计 为 Ims。 根 据 这 一 情况 去 修改 
图 11-6 中 的 程序 。 

[E] 11.2 针对 图 11-7 中 的 程序 ， 重 复习 题 11.1 中 的 问题 。 
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[M] 11.3 考虑 11.3 节 中 闹钟 的 显示 格式 。 我 们 希望 将 时 间 显 示 为 12:00 到 11:59AM 或 PM 的 形式 ,而 
不 是 从 00:00 到 23:59。 假 设 现在 提供 第 四 个 LED， 并 将 其 连接 到 一 个 4 位 宽 PIO 的 心 位 上 ， 
而 不 是 连接 到 11.3 节 中 所 使 用 的 3 位 宽 的 PIO 上 。 该 LED 亮 的 时 候 表示 下 午 (PM )。 修 改 
图 11-6 中 的 程序 以 便 用 这 种 方式 显示 时 间 。 

[M] 11.4 针对 图 11-7 中 的 程序 ， 重 复习 题 11.3 中 的 问题 。 

[E] 11.5 假设 我 们 在 11.3 节 的 闹钟 中 只 使 用 了 一 个 默认 超时 周期 为 1ms 的 定时 器 。 请 对 图 11-6 中 的 程 
序 进 行 适 当 的 修改 来 提供 所 需 的 功能 。 

[E] 11.6 针对 图 11-7 中 的 程序 ， 重 复习 题 11.5 中 的 问题 。 

[E] 11.7 在 图 11-7 中 ,我们 使 用 中 断 来 处 理 分 钟 定时 器 ， 而 对 音调 定时 器 采用 轮 询 法 。 修 改 该 程序 ， 使 
这 两 个 定时 器 都 使 用 中 断 法 。 

[M] 11.8 在 11.3 节 的 闹钟 中 ， 其 时 间 的 设置 是 通过 每 按 下 按键 一 次 就 将 其 当前 值 增加 1 来 实现 的 。 如 
果 一 个 按键 要 被 按 下 多 次 ， 这 将 是 相当 乏味 的 。 一 个 更 好 的 方法 是 在 一 个 按键 被 按 下 时 ， 每 
0.5 秒 就 将 时 间 自 动 增加 1。 为 了 提供 这 一 功能 ， 需 要 在 硬件 层面 作出 什么 样 的 改变 ( 如 果 有 的 
话 ) ?修改 图 11-6 中 的 程序 来 实现 这 一 功能 。 

[M] 11.9 针对 图 11-7 中 的 程序 ， 重 复习 题 11.8 中 的 问题 。 

[M] 11.10 我 们 和 希望 在 首次 开启 电源 时 ， 闹 钟 中 两 个 垂直 排列 的 LED 可 以 每 隔 一 秒 闪 烁 一 次 。 而 一 旦 用 
户 开 始 设置 时 间 ， 它 们 就 应 该 停止 内 烁 。 修 改 图 11-6 中 的 程序 来 完成 这 一 要 求 。 

[M] 11.11 针对 图 11-7 中 的 程序 ， 重 复习 题 11.10 中 的 问题 。 
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并 行 处 理 及 性 能 


本 章 目标 

在 本 章 中 你 将 学 习 以 下 内 容 : 

® 多 线程 

e 通用 处 理 器 和 图 形 处 理 器 中 的 向 量 处 理 

。 共享 存储 器 的 多 处 理 器 

e 共享 数据 的 高 速 缓存 一 致 性 

e 分 布 式 存储 系统 中 的 消息 传递 

。 并 行 编程 

。 性 能 的 数学 建 模 

在 第 6 章 中 描述 了 作为 处 理 器 设计 技术 的 指令 流水 线 和 超标 量 操作 ， 其 目的 是 为 了 提高 
指令 执行 速率 ， 进 而 减少 执行 时 间 。 在 第 8 章 中 ,通过 使 用 高 速 缓存 来 减少 访问 指令 和 数据 的 
平均 延迟 。 

本 章 介 绍 了 另外 三 种 用 于 提高 性 能 的 技术 ， 分 别 为 多 线程 、 向 量 处 理 和 多 重 处 理 。 这 些 
技术 是 在 通用 计算 机 的 多 核 处 理 器 芯片 中 实现 的 ， 它 们 通过 提高 处 理 资源 的 利用 率 和 并 行 执行 
更 多 的 操作 来 提高 性 能 。 


12.1 硬件 多 线程 

操作 系统 ( OS ) 软件 通过 在 不 同 的 程序 间 进 行 上 下 文 切 换 ， 使 得 在 同一 个 处 理 器 上 可 执 
行 多 个 不 同 程序 的 任务 。 正 如 4.9 节 所 述 ， 操 作 系 统 将 一 个 程序 ， 连 同 描述 其 当前 执行 状态 的 
所 有 信息 视 为 一 个 实体 ， 称 为 进程 (process )。 每 个 进程 保持 着 由 操作 系统 分 配 的 关于 存储 器 
和 其 他 资源 的 信息 。 进 程 可 能 与 用 户 在 计算 机 上 打开 的 应 用 程序 ( 如 网 页 浏览 、 文 字 处 理 、 音 
乐 播放 等 ) 相关 。 

每 个 进程 都 有 一 个 相应 的 线程 ， 线 程 是 程序 中 一 条 独立 的 执行 路 径 。 更 确切 地 说 ， 线 程 
(thread ) 是 指 一 个 控制 线程 ， 其 状态 包括 程序 计数 器 和 其 他 处 理 器 寄存 器 的 内 容 。 我 们 将 在 
12.6 节 中 讨论 ， 多 个 线程 可 以 执行 一 个 程序 的 不 同 部 分 ， 而 且 可 以 并 行 运行 ， 就 像 它 们 分 别 对 
应 一 个 单独 的 程序 一 样 。 两 个 或 多 个 线程 可 以 在 不 同 的 处 理 器 上 运行 ， 它 们 可 以 对 不 同 的 数据 
执行 同一 个 程序 的 相同 部 分 ， 也 可 以 执行 同一 个 程序 的 不 同 部 分 。 不 同 程序 的 线程 也 可 以 在 不 
同 的 处 理 器 上 执行 。 一 个 程序 中 的 所 有 线程 都 运行 在 同一 个 地 址 空间 中 并 与 同一 个 进程 有 关 。 

在 这 一 节 中 ,我 们 重点 介绍 在 同一 处 理 器 上 运行 两 个 或 多 个 程序 的 多 任务 处 理 ， 且 每 个 
程序 只 有 一 个 线程 。4.9 节 描 述 了 时 间 片 技术 ， 即 操作 系统 从 那些 目前 没有 阻塞 的 进程 中 选择 
一 个 并 允许 该 进程 运行 很 短 的 一 段 时 间 。 在 时 间 片 中 ， 只 有 被 选择 进程 所 对 应 的 线程 才 是 处 于 
活动 状态 的 。 该 时 间 片 结束 时 的 上 下 文 切换 会 使 操作 系统 选择 另 一 个 不 同 的 进程 ， 其 对 应 的 线 
程 将 在 下 一 个 时 间 片 中 变 为 活动 状态 。 定 时 器 中 断 使 操作 系统 调用 一 个 中 断 服务 程序 来 实现 进 
程 间 的 切换 。 

为 了 有 效 地 处 理 多 个 线程 ， 一 个 处 理 器 往往 包含 多 个 相同 的 寄存 器 组 ， 其 中 包括 多 个 程 
序 计 数 器 ， 每 组 寄存 器 可 专门 用 于 一 个 不 同 的 线程 。 因 此 ， 在 上 下 文 切 换 期 间 不 会 在 保存 和 
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恢复 寄存 器 的 内 容 上 浪费 时 间 。 这 种 处 理 器 被 认为 是 使 用 了 一 种 叫做 硬件 多 线程 (hardware 
multithreading ) 的 技术 。 

通过 使 用 多 组 寄存 器 ， 上 下 文 切换 是 简单 而 快速 的 ， 所 需要 做 的 就 是 改变 处 理 器 中 的 硬 
件 指 针 ， 以 使 用 不 同 的 寄存 器 组 来 读 取 和 执行 后 续 的 指令 。 切 换 到 一 个 不 同 的 线程 可 以 在 一 个 
时 钟 周期 内 完成 。 先 前 的 活动 线程 的 状态 被 保存 在 它 自己 的 那 组 寄存 器 中 。 

切换 到 一 个 不 同 的 线程 可 以 通过 一 个 特定 事件 的 出 现 而 在 任何 时 候 触 发 ， 而 不 是 在 一 个 
固定 的 时 间 间 隔 结 束 时 才 发 生 。 例 如 ， 活动 线程 中 执行 Load 或 Store 指令 时 可 能 会 发 生 高 速 
缓存 失效 ， 此 时 将 会 访问 低速 的 主 存 而 不 是 执行 延迟 操作 ， 处 理 器 可 以 快速 切换 到 一 个 不 同 的 
线程 ， 并 继续 读 取 和 执行 其 他 指令 。 这 被 称 为 粗 粒 度 ( coarse-grained ) 的 多 线程 ， 因 为 在 导致 切 
换 到 男 一 个 线程 的 事件 ( 如 高 速 缓存 失效 ) 发 生 之 前 ， 一 个 线程 可 能 已 经 执行 了 很 多 条 指令 。 

另 一 种 由 于 特定 事件 而 在 线程 间 切 换 的 方法 是 在 每 条 指令 被 取出 后 再 切换 ， 这 被 称 为 细 
粒度 (fine-grained ) 或 交错 (interleaved ) 的 多 线程 ， 其 目的 是 为 了 提高 处 理 器 的 吞吐 量 。 每 
一 条 新 指令 都 是 独立 于 其 他 线程 中 的 前 继 指 令 的 ， 这 可 以 减少 由 于 数据 依赖 而 引起 的 延迟 的 发 
生 。 因此， 通过 将 多 个 线程 的 指令 交错 起 来 可 以 增加 吞吐 量 ， 但 这 需要 较 长 的 时 间 来 完成 给 定 
线程 的 所 有 指令 。 附 录 E 中 描述 的 Intel IA-32 体系 结构 的 处 理 器 中 使 用 了 只 有 两 个 线程 的 多 线 
程 交错 形式 。 


12.2 向 量 ( SIMD ) 处 理 


许多 计算 量 大 的 应 用 程序 使 用 循环 来 对 数据 向 量 执行 操作 ， 在 这 里 向 量 (vector ) 是 一 个 
元 素 为 整数 或 浮 点 数 的 数组 。 当 处 理 器 执行 这 种 循环 中 的 指令 时 ， 它 对 每 个 向 量 元 素 每 次 执行 
一 个 操作 。 因 此 ， 需 要 执行 很 多 指令 来 处 理 所 有 的 向 量 元 素 . 
处 理 器 的 性 能 可 通过 使 用 多 个 ALU 来 提高 ， 在 这 样 的 处 理 器 中 ， 可 以 使 用 一 条 单一 的 指 
令 来 对 多 个 数据 元 素 并 行 操作 。 这 样 的 指令 称 为 单 指令 流 多 数据 流 ( single-instruction multiple- 
data，SIMD ) 指令 ， 它 们 也 被 称 为 向 量 指令 ( vector instruction )。 只 有 在 并 行 执行 的 操作 是 独 
立 的 时 候 这 些 指令 才能 使 用 ， 这 通常 被 称 为 数据 并 行 性 ( data parallelism )。 
向 量 指令 的 数据 保存 在 向 量 寄 存 器 (vector register ) 中 ， 每 个 寄存 器 可 容纳 多 个 数据 元 
素 。 每 个 向 量 寄存 器 中 的 元 素数 量 工 被 称 为 向 量 长 度 (vector length )， 它 决定 了 可 以 在 多 个 
ALU 中 并 行 执行 的 操作 数量 。 如 果 存 在 向 量 指令 可 以 使 不 同 大 小 的 数据 元 素 使 用 相同 的 向 量 
寄存 器 ,那么 L 可 有 所 不 同 。 例 如 ，Intel IA-32 体系 结构 拥有 128 位 的 向 量 寄存 器 ， 其 向 量 长 
度 的 范围 从 L=2 到 L= 16， 对 应 的 整 型 数据 元 素 的 大 小 为 64 位 到 8 位 。 
下 面 通过 一 些 典 型 的 向 量 指令 来 说 明 如 何 使 用 向 量 寄存 器 。 我 们 假设 ， 在 操作 码 助 记 符 
中 增加 一 个 后 缀 S 来 指定 每 个 数据 元 素 的 大 小 ， 这 就 决定 了 一 个 向 量 中 的 元 素数 量 工 。 对 于 访 
问 存储 器 的 指令 来 说 ， 常 规 寄存 器 的 内 容 通常 用 来 计算 有 效 地 址 。 
向 量 指令 
VectorAdd.S Vi,Vj,Vk 
使 用 向 量 寄存 器 Vj 和 Vk 中 的 元 素来 计算 工 个 和 ， 并 将 结果 放 到 向 量 寄存 器 Vi 中 。 类 似 的 指 
令 还 可 用 来 执行 其 他 的 算术 运算 。 
在 向 量 寄存 器 和 存储 器 之 间 传 输 多 个 数据 元 素 需 要 使 用 特别 的 指令 。 指 令 
VectorLoad.S Vi X(R)) 
使 得 从 存储 单元 X+ [Rj] 开始 的 工 个 连续 元 素 被 装 和 向量 寄存 器 Vi 中。 同样， 指令 
VectorStore.S Vi X(R7) 
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将 向 量 寄存 器 Vi 的 内 容 存 放 到 存储 器 中 工 个 连续 的 单元 中 。 

向 量化 

在 用 高 级 语言 编写 的 源 程序 中 ， 考 虑 对 整数 或 浮 点 数 数组 进行 操作 的 循环 ， 如 果 每 一 次 
循环 执行 的 操作 都 是 与 其 他 次 循环 相 独 立 的 ， 则 称 这 个 循环 是 可 向 量化 的 ( vectorizable )。 使 
用 向 量 指令 可 以 减少 需要 执行 的 指令 数 ， 并 可 以 在 多 个 ALU 中 并 行 执 行 多 个 操作 。 向 量化 纺 
译 器 ( vectorizing compiler ) 可 以 识别 这 样 的 不 是 太 复 杂 的 循环 ， 并 生成 向 量 指 令 。 

图 12-1a 给 出 了 一 个 C 语言 编写 的 简单 示例 ， 来 说 明 一 个 循环 的 向 量化 。 假设 A、B 和 C 
数组 在 存储 器 中 的 起 始 位 置 保存 在 寄存 器 R2、R3 和 R4 中 。 使 用 传统 的 汇编 语言 指令 ， 编 译 
器 可 能 会 生成 如 图 12-1b 所 示 的 循环 ， 循 环 体 中 有 9 条 指令 ， 因 此 经 过 循环 入 次 共 要 执行 9N 
条 指令 。 

为 实现 向 量化 循环 ， 编 译 器 必须 识别 : 每 次 经 过 循环 的 计算 是 与 其 他 次 循环 相 独立 的 ， 并 
且 可 以 同时 对 多 个 元 素 执行 同样 的 操作 。 为 简单 起 见 ， 假 设 循环 次 数 X 是 可 被 工整 除 的 。 循 
环 开始 处 的 Load、Add 和 Store 指令 由 相应 的 向 量 指令 替代 ， 这 些 向 量 指令 可 一 次 操作 工 个 元 
素 。 因 此 ， 向 量化 的 循环 只 需要 MZ 次 循环 来 处 理 数组 中 的 所 有 数据 。 由 于 每 次 经 过 循环 会 处 
理工 个 元 素 ， 所 以 寄存 器 R2、R3 和 R4 中 的 地 址 指针 将 递增 4 上 ， 而 寄存 器 Rs 中 的 计数 值 将 
递减 L。 向 量化 的 循环 如 图 12-1c 所 示 。 我 们 假设 汇编 程序 计算 Add 指令 中 以 立即 操作 数 形式 
给 出 的 表达 式 4L 的 值 。 在 循环 体内 仍 有 9 条 指令 , 但是， 因为 现在 的 循环 次 数 为 NIL， 所 以 
需要 执行 的 指令 总 数 只 有 9N/L 条。 


R5 为 循环 计数 器 
R3 指向 数组 B 中 的 一 个 元 素 


R4 指向 数组 C 中 的 一 个 元 素 
将 数组 中 的 一 对 元 素 相 加 

R2 指向 数组 A 中 的 一 个 元 素 
递增 三 个 数组 指针 


Subtract R5, R5, #1 ”递减 循环 计数 器 的 值 
Branch_if [RS5]>0 LOOP 如 果 没 有 结束 则 重复 循环 





b ) 该 循环 的 汇编 语言 指令 


R5 对 进程 中 的 元 素数 量 进 行 计数 
:VectorLoad.S V0, (R3) 从 数组 B 中 加 载 工 个 元 素 
VectorLoad.S V1, (R4) 从 数组 C 中 加 载 志 个 元 素 
VectorAdd.S V0, V0, V1 ”将 数组 中 的 工 对 元 素 相 加 
VectorStore.S V0, (R2) 将 工 个 元 素 存 储 到 数组 A 中 


Add R2, R2, #4*L ”将 数组 指针 递增 工 个 字 
Add R3, R3, #4*L 

Add R4, R4, #4*L 

Subtract RS5, R5, #L 将 循环 计数 器 的 值 递 碱 
Branch_if_[R5]>0 LOOP 如 果 没 有 结束 则 重复 循环 





c ) 该 循环 的 向 量化 形式 
图 12-1 循环 的 向 量化 示例 
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在 计算 机 图 形 处 理 和 数字 信号 处 理 等 应 用 程序 中 存在 着 向 量化 循环 。 这 样 的 循环 中 包含 
许多 可 以 同时 对 多 个 数据 元 素 执 行 的 独立 计算 。 如 果 应 用 程序 的 大 部 分 执行 时 间 花 费 在 执行 这 
种 类 型 的 循环 中 ， 那 么 这 些 循环 的 向 量化 可 以 显著 减少 总 的 执行 时 间 。 性 能 改善 的 程度 是 受 向 
量 长 度 工 的 限制 的 ， 它 决定 了 可 以 并 行 操作 的 ALU 的 数量 。 为 获得 更 高 的 性 能 ， 可 以 用 男 一 
种 方式 实现 对 向 量 ( SIMD ) 处 理 的 支持 ,我 们 将 在 下 一 节 中 介绍 。 


图 形 处 理 单元 

对 计算 机 图 形 处 理 不 断 增长 的 要 求 促使 了 被 称 为 图 形 处 理 单元 ( graphics processing unit， 
GPU ) 的 专用 芯片 的 发 展 。GPU 的 主要 目的 是 为 了 加 快 高 分 辩 率 三 维 图 形 《〈 如 视频 游戏 ) 所 
需要 的 大 量 浮 点 计算 。 因 为 在 这 些 计 算 中 所 涉及 的 操作 往往 是 独立 的 ， 所 以 一 个 大 的 GPU 心 
片 往往 包含 数 百 个 具有 浮 点 ALU 的 简单 内 核 来 并 行 执行 这 些 独立 的 操作 。 

显卡 上 包含 有 一 个 GPU 芯片 和 它 的 专用 存储 器 ， 这 种 显卡 是 插 在 主机 的 扩展 槽 中 的 ， 扩 - 
展 槽 使 用 互 连 标 准 ， 如 第 7 章 中 所 讨论 的 PCIe 标准 。 有 一 个 专门 为 GPU 芯片 的 处 理 内 核 编 写 
的 小 程序 ， 很 多 内 核 会 并 行 执行 该 程序 ， 内 核 执 行 相同 的 指令 ， 但 却 对 不 同 的 数据 元 素 进 行 操 
作 。 一 个 单独 的 控制 程序 会 在 主机 的 通用 处 理 器 中 运行 ， 并 在 必要 时 调用 GPU 程序 。 在 初始 
化 GPU 计算 之 前 ， 主 机 上 的 程序 必须 首先 将 GPU 程序 所 需要 的 数据 从 主 存 传送 到 GPU 的 专 
用 存储 器 中 。 计 算 完 成 后 ， 再 将 所 产生 的 输出 数据 传 回 到 主 存 中 。 

GPU 芯片 的 处 理 内 核 中 有 一 个 专门 的 指令 集 和 硬件 体系 结构 ， 这 与 通用 处 理 器 所 使 用 
的 不 同 。 一 个 例子 就 是 NVIDIA 公司 在 其 GPU 芯片 的 内 核 中 使 用 的 计算 统一 设备 体系 结构 
( Compute Unified Device Architecture，CUDA )。 为 了 便于 编写 涉及 通用 处 理 器 和 GPU 的 程序 ， 
NVIDIA 公司 [1，2] 已 经 开发 出 了 一 种 扩展 的 C 编程 语言 ， 被 称 为 CUDA C 语言 。 它 用 C 语 
言 编写 程序 ， 使 用 特殊 的 关键 字 来 标记 需要 GPU 芯片 中 处 理 内 核 执 行 的 功能 。 编 译 器 和 相关 
的 软件 工具 会 自动 将 目标 程序 划分 成 不 同 的 部 分 并 将 其 分 别 翻译 成 主机 和 GPU 芯片 的 机 器 指 
令 。CUDA C 语言 还 提供 了 一 些 库 例 程 ， 可 以 在 基于 GPU 的 显卡 专用 存储 器 中 分 配 存储 空间 
以 及 在 主 存 和 专用 存储 器 之 间 传 输 数 据 。 业 界 还 提出 了 一 个 称 为 OpenCL 的 开放 标准 作为 包括 
任何 供应 商 GPU 心 片 的 系统 的 编程 框架 [3]。 


12.3 ”共享 存 储 器 的 多 处 理 器 


一 个 多 处 理 器 系统 包含 多 个 可 同时 执行 独立 任务 的 处 理 器 。 这 些 任务 的 粒度 可 以 有 很 大 的 
不 同 。 一 个 任务 可 能 只 包含 单 次 循环 中 的 几 条 指令 ， 也 可 能 包含 在 子 程序 中 执行 的 数 千 条 指令 。 

在 一 个 共享 存储 器 的 多 处 理 器 中 ， 所 有 处 理 器 都 访问 同一 个 存储 器 。 在 不 同 处 理 器 中 运 
行 的 任务 可 以 使 用 相同 的 地 址 来 访问 存储 器 中 的 共享 变量 。 共 享 存 储 器 的 大 小 可 能 是 很 大 的 - 
当 多 个 处 理 器 请 求 同 时 访问 存储 器 时 ， 在 一 个 单一 的 模块 内 实现 一 个 大 的 存储 器 将 产生 瓶颈 - 
可 通过 将 存储 器 分 布 到 多 个 模块 中 来 缓解 这 个 问题 ， 这 样 从 不 同 处 理 器 同时 发 出 的 请 求 很 可 能 
会 根据 其 地 址 来 访问 不 同 的 存储 器 模块 。 

互连网 络 使 得 任何 处 理 器 都 可 以 访问 共享 存储 器 中 的 任何 模块 。 当 存储 模块 在 物理 上 独 
立 于 处 理 器 时 ， 所 有 访问 存储 器 的 请 求 都 必须 通过 网 络 来 实现 ， 这 将 引入 延迟 。 岁 12-2 显示 
了 这 样 一 种 布局 。 所 有 从 处 理 器 到 存储 模块 的 访问 都 有 相同 网 络 延迟 的 系统 被 称 为 统一 存储 器 
访问 (Uniform Memory Access，UMA ) 的 多 处 理 器 。 虽 然 延 迟 是 相同 的 ， 但 它 对 连接 多 个 处 
理 器 和 存储 模块 的 网 络 而 言 可 能 是 很 大 的 。 

为 了 获得 更 好 的 性 能 ， 需 要 将 存储 模块 放置 在 接近 每 个 处 理 器 的 位 置 。 这 样 就 形成 了 一 
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个 节点 (node ) 集合 ， 每 个 节点 包含 了 一 个 处 理 器 和 一 个 存储 模块 。 然 后 ， 这 些 节 点 连接 到 
网 络 中 ， 如 图 12-3 所 示 。 当 处 理 器 发 出 访问 本 地 存储 器 的 请 求 时 ， 可 以 避免 网 络 延迟 。 然 而 ， 
一 个 访问 远程 存储 模块 的 请 求 必 须 通过 网 络 。 由 于 访问 本 地 存储 器 和 远程 共享 存储 器 的 延迟 
是 有 差异 的 ， 所 以 这 种 类 型 的 系统 被 称 为 非 统 一 存储 器 访问 (Non-Uniform Memory Access， 
NUMA ) 的 多 处 理 器 。 
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图 12-2 UMA 多 处 理 器 图 12-3 NUMA 多 处 理 器 


互连网 络 

互连网 络 必须 能 够 允许 信息 在 系统 中 的 任意 两 个 节点 之 间 进 行 传输 ， 网 络 还 可 以 用 来 从 
一 个 节点 向 许多 其 他 的 节点 广播 信息 。 其 中 网 络 流量 是 由 请 求 ( 例如 读 和 写 ) 和 数据 传输 组 
成 的 。 

某 个 特定 网 络 是 否 适用 往往 是 通过 它 的 成 本 、 带 宽 、 有 效 吞 吐 量 和 实现 的 难 易 程度 等 方 
面 来 判断 的 。 带 宽 (bandwidth ) 是 指 用 来 传输 数据 的 传输 链 路 的 能 力 ， 它 使 用 每 秒 传送 的 位 
数 或 字 节 数 来 表示 。 有 效 吞吐 量 ( effective throughput ) 是 数据 传输 的 实际 速率 。 这 个 速率 是 小 
于 可 用 带宽 的 ， 因 为 一 个 给 定 的 链 路 还 必须 承载 用 于 协调 数据 传输 的 控制 信息 。 

信息 通过 网 络 传输 通常 是 以 固定 长 度 和 指定 格式 的 数据 包 (packet ) 形式 进行 的 。 例 如 ， 
一 个 读 请 求 可 能 是 一 个 从 处 理 器 发 送 到 存储 模块 的 单一 数据 包 。 该 数据 包 包 含 源 和 目的 节点 的 
标识 符 ， 将 要 被 读 取 的 单元 的 地 址 ， 以 及 一 个 用 来 指示 读 操作 类 型 的 命令 字段 。 一 个 向 存储 模 
块 中 写 人 一 个 字 的 写 请 求 也 可 能 是 一 个 包含 将 要 被 写 人 的 数据 的 单一 数据 包 。 而 另 一 方面 ， 一 
个 读 响应 可 能 会 涉及 整个 高 速 缓存 块 ， 这 需要 使 用 多 个 数据 包 来 进行 数据 传输 。 

理想 情况 下 ， 一 个 完整 的 数据 包 可 以 在 一 个 时 钟 周期 内 在 网 络 中 的 任何 节点 或 交换 机 上 
并 行 处 理 ， 这 就 意味 着 要 有 许多 电线 构成 较 宽 的 链 路 。 然 而 ， 为 了 降低 成 本 和 复杂 性 ， 通 常 需 
要 尽 可 能 地 减少 链 路 的 宽度 。 在 这 种 情况 下 ， 一 个 数据 包 必 须 被 划分 成 较 小 的 块 ， 以 便于 每 一 
个 小 块 都 可 以 在 一 个 时 钟 周 期 内 被 传输 完成 。 

以 下 各 小 节 将 描述 一 些 在 多 处 理 器 中 普遍 使 用 的 互连网 络 。 

1.， 总线 

总 线 (bus ) 是 指 为 信息 传输 提供 共享 路 径 的 一 组 线路 ( 电线 )， 如 第 7 章 所 述 。UMA 多 
处 理 器 中 通常 使 用 总 线 来 连接 多 个 处 理 器 和 多 个 共享 的 存储 模块 。 为 了 确保 在 任何 时 候 只 授权 
一 个 请 求 使 用 总 线 ， 需 要 使 用 仲裁 。 总 线 适 用 于 处 理 器 数量 相对 较 少 的 情况 ， 因 为 当 连 接 了 多 
个 处 理 器 时 ， 对 总 线 的 访问 会 产生 竞争 ， 而 且 电 力 负荷 会 增加 传播 延迟 。 

一 个 简单 的 总 线 在 当前 请 求 得 到 响应 之 前 不 允许 新 的 请 求 出 现在 总 线 上 。 然 而 ， 如 果 响 
应 延迟 很 高 ， 就 有 可 能 造成 总 线 上 出 现 相 当 大 的 空闲 时 间 。 
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通过 使 用 分 割 事务 ( split-transaction ) 总 线 可 以 实现 更 高 的 性 能 ， 在 这 种 总 线 中 ， 请 求 及 
其 相应 的 响应 会 被 视 为 两 个 单独 的 事件 ， 而 其 他 的 传输 有 可 能 在 它们 之 间 发 生 。 考 虑 这 样 一 种 
情况 ， 其 中 多 个 处 理 器 需要 向 存储 器 发 出 读 请 求 。 我 们 使 用 仲裁 选择 第 一 个 处 理 器 来 使 用 总 线 
发 送 请 求 。 当 其 请 求 发 送 后 ， 再 选择 第 二 个 处 理 器 来 使 用 总 线 发 送 请 求 ， 而 不 让 总 线 空闲 。 假 
定 这 个 请 求 是 对 另 一 个 不 同 的 存储 模块 进行 访问 ， 那 么 这 两 个 读 访 问 可 以 并 行进 行 。 如 果 两 个 
模块 都 没有 完成 其 访问 ， 那 么 将 选择 第 三 个 处 理 器 来 发 送 其 请 求 ， 并 以 此 类 推 。 最 终 ， 一 个 存 
储 模块 会 完成 其 读 访问 ， 它 会 被 授予 使 用 总 线 将 数据 传输 给 发 送 请 求 的 处 理 器 。 当 其 他 模块 完 
成 它们 的 访问 后 ， 总 线 就 用 来 传输 它们 的 响应 。 每 个 请 求 与 相应 的 响应 之 间 的 实际 时 间 长 度 可 
能 会 有 所 不 同 ， 因 为 存储 器 中 不 同事 务 的 请 求 和 响应 是 在 总 线 上 交错 的 ， 以 便 有 效 地 利用 可 用 
带宽 。 

分 割 事务 总 线 需要 一 个 更 复杂 的 总 线 协 议 。 因 为 它 需 要 将 每 个 响应 与 其 对 应 的 请 求 相 匹 
配 。 这 通常 是 通过 将 一 个 独特 的 标签 与 总 线 上 出 现 的 每 个 请 求 相 关联 来 处 理 的 。 然 后 每 个 响应 
以 适当 的 标签 出 现 ， 从 而 可 以 将 其 与 原来 的 请 求 进行 匹配 。 

2.， 环 状 网 

环 状 网 是 由 节点 之 间 的 点 对 点 连接 形成 的 ， 如 图 12-4 所 示 。 图 12-4a 显示 了 一 个 单 环 。 一 
个 较 长 的 单 环 会 导致 任意 两 个 节点 间 通 信和 的 平均 延迟 较 高 。 有 两 种 不 同 的 方法 可 以 降低 延迟 。 

一 种 方法 是 增加 第 二 个 环 来 以 相反 的 方向 连接 节点 。 由 此 产生 的 双向 环 (bidirectional 
ring ) 可 将 平均 延迟 减 半 ， 并 使 带宽 加 倍 。 人 然而， 通信 的 处 理会 更 复杂 。 

另 一 种 方法 是 使 用 层次 结构 ( hierarchy ) 的 环 。 图 12-4b 所 示 的 是 一 个 两 层 结构 的 环 。 高 
层 的 环 连接 低层 的 环 。 这 种 安排 可 以 减少 低层 环 上 任意 两 个 节点 间 通 信 的 平均 延迟 。 同 一 低层 
环 上 节点 之 间 的 传输 不 需要 经 过 高 层 环 。 不 同 的 低层 环 上 节点 之 间 的 传输 需要 经 过 高 层 环 的 一 
部 分 。 这 种 层次 方案 的 缺点 是 : 当 不 同 的 低层 环 上 有 许多 节点 经 常 相互 通信 时 ， 高 层 环 可 能 会 








成 为 瓶颈 。 
a ) 单 环 
b ) 环 的 层次 结构 
图 12-4 基于 环 的 互连网 络 
3.， 交叉 开关 网 


交叉 开关 网 ( crossbar ) 是 一 种 可 以 在 连接 到 网 络 上 的 任意 一 对 单元 之 间 提 供 直接 链接 的 
网 络 ， 它 通常 用 于 UMA 多 处 理 器 系统 中 ， 用 以 连接 处 理 器 和 存储 模块 。 如 果 多 个 请 求 的 目的 
地 不 同 ， 那 么 交叉 开关 网 络 可 以 使 得 多 个 传输 同步 进行 。 例 如 ， 我 们 可 以 使 用 图 12-5 所 示 的 
交叉 开关 集合 来 实现 图 12-2 中 的 结构 。 对 于 n 个 处 理 器 和 个 存储 器 ， 需 要 n xk 个 开关 。 
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图 12-5 交叉 开关 互连网 络 


4， 网 状 网 
将 大 量 节点 连接 起 来 的 一 种 较 自然 的 方式 是 二 维 网 状 网 
(mesh )， 如 图 12-6 所 示 。 网 状 网 内 部 的 每 个 节点 有 4 个 连接 ， 
其 中 每 一 个 连接 与 其 水 平和 垂直 方向 的 相 邻 节点 相连 。 而 网 状 
网 边界 和 角落 上 的 节点 由 于 有 较 少 的 相 邻 节点 ， 因 此 只 有 较 少 
的 连接 。 为 了 减少 网 状 网 中 相隔 很 远 的 节点 之 间 的 通信 延迟 ， 
可 以 在 网 状 网 相对 边界 的 节点 间 引入 环绕 连接 。 具 有 这 种 连接 
的 网 络 被 称 为 回环 (torus )。 一 个 贺 环 中 的 所 有 节点 都 有 四 个 连 
接 。 平 均 延 迟 被 降低 了 ， 但 相对 简单 的 网 状 网 而 言 ， 通 过 圆 环 
的 路 由 请 求 和 响应 实现 起 来 较为 复杂 。 靖 语 g 二 不 王 全 疝 况 的 病员 


12.4 高 速 缓存 一 致 性 

共享 存储 器 的 多 处 理 器 比较 易于 编程 。 程 序 中 的 每 一 个 变量 都 在 存储 器 中 有 一 个 唯一 的 
地 址 单元 ， 任 何 处 理 器 都 可 以 访问 该 地 址 单元 。 然 而 ， 每 个 处 理 器 都 有 它 自 己 的 高 速 缓存 ， 因 
此 ， 在 几 个 高 速 缓存 中 可 能 保存 着 共享 数据 的 副本 。 当 任何 一 个 处 理 器 在 它 自己 的 高 速 缓存 中 
对 共享 变量 进行 写 操作 时 ， 那 么 所 有 包含 该 变量 副本 的 其 他 高 速 缓存 中 将 会 有 旧 的 、 不 正确 的 
值 。 所 以 必须 将 这 一 变化 告知 相关 的 高 速 缓存 ， 以 便于 它们 可 以 将 其 副本 更 新 为 新 值 或 者 变 为 
无 效 。 这 就 是 保持 高 速 缓存 一 致 性 (cache coherence ) 的 问题 ， 它 要 求 多 个 高 速 缓存 中 的 共享 
数据 要 有 一 致 的 值 。 

在 第 8 章 中 我 们 讨论 了 两 种 对 高 速 缓存 中 的 数据 进行 写 操 作 的 基本 方法 。 直 接 写 ( write- 
through ) 方法 是 对 高 速 缓存 和 主 存 中 的 数据 同时 修改 ， 而 写 回 ( write-back ) 方法 只 改变 高 速 组 
存 中 的 数据 ， 而 主 存 中 的 副本 只 在 高 速 缓存 中 被 修改 的 数据 块 必须 要 被 替换 时 才 会 被 更 改 。 多 
处 理 器 系统 中 的 高 速 缓存 一 致 性 也 可 以 采用 类 似 的 方法 来 解决 。 


12.4.1 直接 写 协议 
直接 写 协议 可 以 通过 两 种 方式 实现 。 一 种 方式 是 更 新 其 他 高 速 缓存 中 的 值 ， 第 二 种 方式 
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是 使 其 他 高 速 绥 存 中 的 副本 无 效 。 

我 们 先 来 看 一 下 更 新 ( update ) 协议 。 当 处 理 器 对 其 高 速 缓存 中 的 数据 块 写 入 一 个 新 值 
时 ， 这 个 新 值 也 将 被 写 人 包含 该 修改 块 的 存储 模块 中 。 由 于 这 个 块 的 副本 在 其 他 高 速 缓存 中 也 
可 能 存在 ， 所 以 这 些 副 本 也 必须 被 同时 修改 以 反映 出 由 该 写 操作 所 引起 的 变化 。 最 简单 的 实现 
方法 是 向 系统 中 所 有 处 理 器 的 高 速 缓存 广播 要 写 人 的 数据 。 当 每 个 处 理 器 接收 到 这 个 广播 数据 
时 ， 如 果 在 它 的 高 速 缓存 中 存在 这 个 受 影响 的 高 速 缓存 块 ， 那 么 处 理 器 就 修改 该 块 的 内 容 。 

实现 直接 写 协议 的 第 二 种 方式 是 使 副本 无 效 ( invalidation )。 当 一 个 处 理 器 向 它 的 高 速 组 
存 中 写 人 一 个 新 值 时 ， 这 个 新 值 也 被 发 送 到 存储 器 中 的 适当 位 置 ， 并 且 使 其 他 高 速 缓存 中 的 所 
有 副本 都 无 效 。 同 样 可 以 采用 广播 的 方式 在 系统 中 发 送 使 副本 无 效 的 请 求 。 


12.4.2” 写 回 协议 


使 用 写 回 协议 保持 一 致 性 是 基于 存储 器 中 数据 块 的 所 有 权 概 念 的。 最 初 ， 存 储 髓 是 所 有 
块 的 所 有 者 ， 然 后 存储 器 保留 由 处 理 器 读 取 的 任何 数据 块 的 所 有 权 ， 并 将 一 个 副本 放 到 处 理 器 
的 高 速 缓存 中 。 

如 果 某 个 处 理 器 想 要 向 其 高 速 缓存 中 写 人 一 个 数据 块 ， 那 么 它 必 须 首先 成 为 此 数据 块 的 
独家 所 有 者 。 要 实现 此 目的 ， 必 须 先 通过 一 个 广播 请 求 使 其 他 高 速 缓存 中 的 所 有 副本 都 无 效 。 
然后 该 块 的 新 所 有 者 就 可 以 随意 修改 相关 内 容 ， 而 无 需 采 取 任何 其 他 行动 。 

当 男 一 个 处 理 右 想 要 读 取 一 个 已 被 修改 的 块 ， 其 请 求 必须 被 转发 到 该 块 的 当前 所 有 者 。 
然后 再 由 当前 所 有 者 将 数据 发 送 给 提出 请 求 的 处 理 器 ， 该 数据 也 会 被 发 送 给 相应 的 存储 模块 ， 
该 模块 会 重新 获取 所 有 权 并 更 新 存储 器 中 该 块 的 内 容 。 作 为 该 块 之 前 所 有 者 的 处 理 器 ， 其 高 速 
缓存 中 还 保留 有 该 块 的 副本 。 此 时 ， 该 块 通过 在 两 个 高 速 缓存 和 存储 器 中 的 副本 来 实现 共享 。 
来 自 其 他 处 理 需 的 读 取 该 数据 块 的 后 续 请 求 由 包含 该 数据 块 的 存储 模块 响应 。 

当 另 一 个 处 理 吕 硕 望 对 一 个 已 被 修改 的 块 进 行 写 操作 时 ， 该 块 的 当前 所 有 者 将 数据 发 送 
给 提出 请 求 的 处 理 器 ， 同 时 将 该 块 的 所 有 权 传 送 给 提出 请 求 的 处 理 器 并 使 其 自身 所 缓存 的 副本 
无 效 。 由 于 该 块 正在 被 新 的 所 有 者 修改 ， 所 以 存储 器 中 该 块 的 内 容 还 没有 被 更 新 。 因 此 ， 对 该 
数据 块 的 下 一 个 请 求 将 由 新 的 所 有 者 响应 。 

写 回 协议 与 直接 写 协 议 相 比 具 有 通信 量 少 的 优势 ， 这 是 因为 一 个 高 速 缓存 块 在 被 其 他 的 
处 理 器 需要 之 前 ， 一 个 处 理 器 可 能 对 这 个 块 执行 了 若干 次 写 操作 。 若 使 用 写 回 协议 ， 一 旦 获得 
所 有 权 并 发 送 一 个 无 效 请 求 后 ， 这 些 写 操作 就 只 在 该 处 理 器 自己 的 高 速 缓存 中 进行 。 而 若 使 用 
直接 写 协议 ， 每 个 写 操作 还 必须 对 适当 的 存储 模块 进行 操作 ， 并 向 其 他 高 速 缓存 进行 广播 。 

到 目前 为 止 ， 我 们 一 直 假定 这 些 协议 中 的 更 新 和 无 效 请 求 操作 都 是 通过 互连网 络 来 广播 
的 。 实 现 这 种 广播 的 难 易 在 很 大 程度 上 取决 于 互连网 络 的 结构 。 支 持 广播 的 最 自然 的 网 络 是 单 
总 线 。 在 使 用 单 总 线 将 适量 的 处 理 器 连接 到 存储 模块 上 的 多 处 理 器 系统 中 ， 高 速 缓存 的 一 致 性 
是 利用 监听 方法 来 实现 的 。 


12.4.3 监听 高 速 缓存 


在 单 总 线 系 统 中 ， 处 理 器 和 存储 模块 之 间 的 全 部 交互 都 是 通过 总 线 请 求 和 响应 完成 的 。 
实际 上 ， 它 们 是 向 连接 到 总 线 上 的 所 有 部 件 进行 广播 。 假 设 每 个 处 理 器 的 高 速 缓存 都 有 一 个 控 
制 电路 来 观察 或 监听 ( snoop ) 总 线 上 的 所 有 交互 情况 。 现 在 我 们 将 描述 写 回 协议 的 某 些 情况 ， 
以 及 如 何 保持 高 速 缓存 一 致 性 。 

考虑 一 个 处 理 器 ， 它 之 前 已 经 从 存储 器 中 读 取 了 一 个 块 的 副本 到 它 的 高 速 缓存 中 。 在 
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第 一 次 对 这 个 块 进行 写 操作 之 前 ， 处 理 器 必须 向 其 他 所 有 的 高 速 缓存 广播 无 效 请 求 
(invalidation request )， 而 其 他 高 速 缓存 的 控制 器 接受 请 求 并 使 其 保存 的 该 块 的 副本 无 效 。 这 
个 操作 会 导致 提出 请 求 的 处 理 器 成 为 该 块 的 新 所 有 者 。 然 后 这 个 处 理 器 可 以 对 该 块 进行 写 操 
作 并 将 其 标记 为 被 修改 的 。 该 处 理 器 再 对 其 高 速 缓存 中 已 被 修改 的 这 个 块 进行 写 操作 时 就 不 
需要 进行 广播 了 . 

现在 ， 如 果 另 一 个 处 理 器 在 总 线 上 广播 对 该 块 的 读 请 求 (read request )， 存 储 器 不 能 响应 ， 
因为 它 不 是 该 块 的 当前 所 有 者 。 拥 有 该 请 求 块 的 处 理 器 监听 总 线 上 的 读 请 求 。 因 为 它 在 其 高 速 
缓存 中 保存 了 该 请 求 块 修改 后 的 副本 ， 所 以 它 在 总 线 上 发 出 一 个 特殊 的 信号 以 防止 存储 器 进行 
响应 。 然 后 所 有 者 在 总 线 上 广播 该 块 的 副本 ， 并 将 其 标记 为 干净 的 〈 未 被 修改 的 )。 总 线 上 的 
数据 响应 被 发 出 读 请 求 的 处 理 器 的 高 速 缓存 接受 。 该 数据 响应 同样 也 被 存储 器 接受 以 更 新 其 保 
存 的 该 块 的 副本 。 这 时 ， 存 储 器 重新 获得 该 块 的 所 有 权 ， 该 块 处 于 共享 状态 ， 因 为 其 副本 存在 
于 两 个 处 理 器 的 高 速 缓存 中 。 这 两 个 被 缓存 的 副本 和 存储 器 中 的 副本 都 包含 相同 的 数据 ， 所 以 
就 保持 了 一 致 性 。 此 后 来 自任 何 处 理 器 的 后 续 请 求 都 是 由 存储 器 来 响应 的 。 

现在 考虑 这 样 一 种 情况 ， 两 个 处 理 器 在 其 各 自 的 高 速 缓存 中 存 有 相同 块 的 副本 ， 它 们 试 
图 在 同一 时 间 对 相同 的 高 速 缓存 块 进 行 写 操作 。 由 于 该 块 处 于 共享 状态 ， 所 以 存储 器 是 该 块 的 
所 有 者 。 因 此 ， 这 两 个 处 理 器 都 请 求 使 用 总 线 来 广播 一 条 无 效 消息 。 其 中 一 个 处 理 器 首先 被 授 
权 使 用 总 线 ， 它 将 其 无 效 请 求 进行 广播 并 成 为 该 块 的 新 所 有 者 。 通 过 监听 ， 另 一 个 处 理 器 高 速 
缓存 中 该 块 的 副本 被 置 为 无 效 。 当 该 处 理 器 后 来 被 授权 使 用 总 线 时 ， 它 将 广播 一 个 独占 性 的 读 
请 求 ( read-exclusive request )。 这 一 请 求 结 合 了 对 同一 块 的 读 请 求 和 无 效 请 求 。 第 一 个 处 理 器 
的 控制 器 监听 该 独占 性 的 读 请 求 ， 在 总 线 上 提供 一 个 数据 响应 ， 并 将 其 高 速 缓存 中 的 副本 置 为 
无 效 。 因 此 该 块 的 所 有 权 被 转移 到 第 二 个 提出 请 求 的 处 理 器 。 因 为 该 块 马 上 要 被 再 次 修改 ， 所 
以 存储 器 中 的 内 容 不 会 更 新 。 由 于 这 两 个 处 理 器 的 请 求 被 按 顺序 处 理 ， 所 以 在 任何 时 候 都 保持 
了 高 速 缓存 的 一 致 性 。 

刚才 所 描述 的 方案 是 基于 高 速 缓存 控制 器 能 够 观察 总 线 上 的 活动 并 采取 适当 措施 的 能 力 
的 ， 这 样 的 方案 被 称 为 监听 高 速 缓存 ( snoopy-cache ) 技术 。 


出 于 性 能 方面 的 原因 ， 监 听 功 能 是 不 能 干扰 处 理 器 和 其 高 速 缓存 的 正常 操作 的 。 如 果 对 . 


于 总 线 上 的 每 个 请 求 ， 高 速 缓存 控制 器 都 要 访问 高 速 缓存 的 标志 位 ， 便 会 产生 这 种 干扰 。 在 大 
多 数 情况 下 ， 高 速 缓存 中 不 包含 相关 请 求 块 的 有 效 副 本 。 为 了 消除 不 必要 的 干扰 ， 每 个 高 速 组 
存 都 提供 了 一 套 与 高 速 缓 存 中 块 的 状态 信息 相同 的 重复 标志 ， 但 这 些 标志 信息 可 以 被 监听 电路 
单独 访问 。 


12.4.4 ”基于 目录 的 高 速 缓存 一 致 性 


监听 高 速 缓 存 的 概念 在 单 总 线 系统 中 是 很 容易 实现 的 。 大 型 的 共享 存储 器 多 处 理 器 系统 
使 用 诸如 环 状 网 和 网 状 网 的 互连网 络 。 在 这 种 系统 中 ， 将 每 个 请 求 广 播 到 所 有 处 理 器 的 高 速 组 
存 是 无 效率 的 。 一 个 可 扩展 的 ， 但 更 复杂 的 方案 是 在 每 个 存储 模块 中 使 用 目录 ( directory ) 来 
指出 哪些 节点 中 可 能 包含 一 个 处 于 共享 状态 的 给 定 块 的 副本 。 如 果 一 个 块 被 修改 ， 目 录 将 标识 
作为 当前 所 有 者 的 那个 节点 。 每 个 来 自 处 理 器 的 请 求 都 必须 首先 发 送 到 包含 有 关 块 的 存储 模块 
中 ， 用 该 块 的 目录 信息 来 确定 需要 采取 何 种 操作 。 如 果 该 块 被 修改 ， 那 么 读 请 求 将 被 转发 给 该 
块 的 当前 所 有 者 。 对 于 向 一 个 共享 块 发 出 写 请 求 的 情况 ， 无 效 请 求 只 单独 发 送 给 包含 有 该 块 副 
本 的 节点 。 这 种 基于 目录 的 实现 高 速 缓存 一 致 性 的 方案 ， 由 于 其 成 本 和 复杂 性 ， 限 制 了 它 只 能 
在 大 型 系统 中 使 用 。 小 型 的 多 处 理 器 系统 ， 包 括 目前 的 多 核 芯片 ， 通 常 使 用 监听 技术 。 
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12.5 消息 传递 多 计算 机 

使 用 多 个 处 理 器 的 另 一 种 不 同方 式 是 将 系统 中 的 每 个 节点 作为 拥有 它 自己 存储 器 的 一 台 
完整 计算 机 来 实现 。 系 统 中 的 其 他 计算 机 不 能 直接 访问 该 计算 机 的 存储 器 。 需 要 共享 的 数据 
是 通过 在 计算 机 之 间 发 送 消息 来 进行 交换 的 。 这 种 系统 被 称 为 消息 传递 多 计算 机 ( message- 
passing multicomputer ) 系统 。 

消息 传递 多 计算 机 系统 中 并 行程 序 的 编写 是 不 同 于 共享 存储 器 的 多 处 理 器 系统 的 。 为 了 
在 节点 间 共 享 数 据 ， 在 数据 源 计算 机 上 运行 的 程序 必须 发 送 包 含 相关 数据 的 消息 到 目的 计算 机 
上 。 在 目的 计算 机 上 运行 的 程序 收 到 消息 后 ， 再 将 数据 复制 到 那个 节点 的 存储 器 中 。 

为 了 方便 消息 传递 ， 每 个 节点 上 的 一 个 特殊 通信 部 件 通 常 负责 格式 化 和 解释 所 发 送 和 接 
收 消息 的 低层 细节 ， 并 负责 向 或 从 节点 的 存储 器 复制 消息 数据 。 每 个 节点 中 的 计算 机 发 送 命令 
到 通信 部 件 ， 然 后 计算 机 继续 执行 其 他 计算 ， 而 通信 部 件 将 会 处 理 所 发 送 和 接收 消息 的 细节 。 


12.6 ”多 处 理 器 并 行 编程 


前 几 节 讨论 了 共享 存储 器 多 处 理 器 系统 的 硬件 组 成 ， 它 可 以 利用 应 用 程序 中 的 并 行 性 。 
而 并 行 性 可 能 存在 于 循环 中 ( 其 每 次 循环 都 是 独立 的 )， 也 可 能 存在 于 独立 的 高 级 任务 中 。 

用 高 级 语言 编写 的 源 程序 允许 程序 员 以 易于 理解 的 方式 来 表示 所 需 的 计算 ， 它 必须 被 编 
译 器 和 汇编 程序 翻译 成 机 器 语言 表示 形式 。 处 理 器 的 硬件 是 被 设计 为 按 顺 序 执行 机 器 语言 指令 
的 ， 以 便 能 执行 程序 员 所 需 的 计算 。 它 不 能 自动 识别 独立 的 、 可 以 并 行 执行 的 高 级 任务 。 编 译 
器 也 存在 检测 和 利用 并 行 性 的 局 限 性 。 因 此 ， 程 序 员 需 要 将 源 程序 中 的 整体 计算 划分 为 相关 任 
务 ， 并 指定 它们 是 如 何在 多 个 处 理 器 上 执行 的 。 

共享 存储 器 的 多 处 理 器 系统 中 的 编程 是 单一 处 理 器 中 传统 编程 的 自然 延伸 。 高 级 语言 源 
程序 是 用 处 理 器 可 执行 的 任务 编写 的 。 但 某 些 任 务 也 可 以 在 不 同 的 处 理 器 中 同时 执行 。 通 过 定 
义 不 同 的 处 理 器 在 执行 分 配给 它们 的 任务 时 所 读 写 的 全 局 变量 ， 可 实现 数据 共享 。 当 前 通用 计 
算 机 中 使 用 的 多 核 芯片 ， 如 实现 Intel IA-32 体系 结构 的 多 核 芯片 ， 就 是 以 这 种 方式 来 编程 的 。 

为 了 说 明 并 行 编程 ， 我 们 考虑 一 个 计算 两 个 向 量 的 点 积 的 示例 ， 其 中 每 个 向 量 包含 N 个 
数 ， 图 12-7 给 出 了 一 个 实现 该 任务 的 C 语言 程序 。 此 例 中 ,初始 化 两 个 向 量 内 容 的 细节 被 省 
略 ， 而 把 重点 放 在 并 行 编程 的 有 关 方 面 。 


#include <stdioh> /x* 输 入 /输出 例 程 *#/ 
#define N 100 此 每 个 向 其 中 的 元 素数 */ 
double 。 a[IN],bIN];，# 计算 点 积 的 向 量 */ 
void main (void) 


{ 





int i; 
double dot_product; 


< Initialize vectors a[], b[] - details omitted.> 
dot_product = 0.0; 
for (i1=0;i< Nii++) 

dot_product = dot_product + a[i] * b[i]; 
printf ("The dot product is %g\ n", dot_product); 





图 12-7 计算 点 积 的 C 程序 
循环 中 将 N 个 乘积 的 总 和 累加 起 来 ， 每 次 循环 都 依赖 于 前 一 次 循环 所 计算 的 部 分 和 ， 在 
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最 后 一 次 循环 中 计算 出 的 结果 就 是 点 积 。 尽 管 每 次 循环 是 相互 依赖 的 ， 但 还 是 可 以 通过 利用 加 
法 的 关联 属性 ， 将 程序 划分 为 独立 的 任务 ， 以 便 同 时 执行 。 每 个 任务 计算 一 个 部 分 和 ， 最 终 的 
结果 可 通过 将 所 有 的 部 分 和 相 加 而 得 到 。 

要 实现 上 述 计 算 点 积 的 并 行程 序 ， 我 们 需要 回答 以 下 两 个 问题 : 

e@ 如 何 使 多 个 处 理 器 参与 到 并 行 计 算 部 分 和 的 操作 中 ? 

e 如 何 确保 在 计算 点 积 的 最 终结 果 前 ， 每 个 处 理 器 都 已 完成 其 部 分 和 的 计算 ? 

1. 线程 的 创建 

为 回答 第 一 个 问题 ， 我 们 需 定 义 可 分 配给 不 同 处 理 器 执行 的 任务 ， 然 后 描述 这 些 任 务 是 
如 何在 多 个 处 理 器 中 执行 的 。 我 们 可 以 编写 一 个 并 行 版 本 的 计算 点 积 的 程序 ， 用 参数 P 表示 
处 理 器 的 数量 ， 参 数 YX 表示 每 个 向 量 中 的 元 素数 。 为 简单 起 见 ， 我 们 假定 YX 可 被 尸 整除 。 整 
个 计算 涉及 N 个 乘积 的 和 ， 对 于 己 个 处 理 器 ， 我 们 定义 己 个 独立 任务 ， 其 中 每 个 任务 用 于 计 
算 WP 个 乘积 的 部 分 和 。 

当 一 个 程序 在 一 个 单 处 理 器 中 执行 时 ， 有 一 个 活动 的 执行 控制 线程 。 该 线程 是 由 操作 系 
统 (OS ) 在 开始 执行 程序 时 隐 式 创建 的 。 对 于 并 行程 序 ， 我 们 需要 使 用 多 个 执行 控制 线程 
(每 个 处 理 器 一 个 ) 来 单独 处 理 独 立 的 任务 。 这 些 线程 必须 被 明确 地 创建 。 一 个 典型 的 方法 是 
使 用 程序 库 中 名 为 create_thread 的 例 程 来 支持 并 行 编程 。 该 库 例 程 接受 一 个 输入 参数 ， 该 参数 
是 指向 新 创建 线程 所 要 执行 的 子 程序 的 指针 。 该 库 例 程 调用 操作 系统 的 服务 来 创建 一 个 具有 独 
立 堆栈 的 新 线程 ， 以 便于 它 可 以 调用 其 他 的 子 程序 以 及 拥有 其 自己 的 局 部 变量 。 而 所 有 的 全 局 
变量 是 在 所 有 的 线程 之 间 共 享 的 。 

将 线程 彼此 区 分 开 来 是 很 有 必要 的 。 一 种 方法 是 提供 一 个 称 为 get_my_thread id 的 库 例 
程 ， 它 为 每 个 线程 返回 一 个 介 于 0 和 P-l 之 间 的 唯一 整数 。 有 了 这 些 信息 ， 线 程 便 可 以 确定 
整个 计算 中 它 所 负责 的 适当 的 子 集 。 

2.， 线程 同步 

第 二 个 问题 需要 确定 线程 何 时 完成 它们 的 任务 ， 从 而 可 以 正确 地 计算 最 终 的 结果 。 这 就 
需要 多 线程 的 同步 ( synchronization ) 技术 了 。 有 几 种 线程 同步 的 方法 ， 它 们 往往 是 通过 为 并 
行 编程 增加 额外 的 库 例 程 来 实现 的 。 在 这 里 ， 我 们 讨论 一 种 称 为 屏障 ( barrier ) 的 方法 。 

屏障 的 目的 是 迫使 线程 等 待 ， 直 到 它们 到 达 程 序 中 某 个 指定 的 位 置 为 止 ， 在 该 位 置 处 线程 
会 调用 屏障 库 例 程 。 每 一 个 线程 在 调用 屏障 例 程 后 会 进入 一 个 忙 等 循环 ， 直 到 最 后 一 个 线程 调 
用 屏障 例 程 后 ， 所 有 的 线程 继续 执行 。 这 就 确保 了 线程 都 已 完成 了 屏障 调用 指令 前 各 自 的 计算 。 

3 并行 程序 示例 

前 面 已 描述 过 关于 线程 的 创建 和 同步 的 问题 ， 以 及 用 于 线程 管理 的 典型 库 例 程 ， 现 在 
我 们 介绍 一 个 并 行 的 点 积 程序 示例 。 图 12-8 显示 了 主 程序 和 另 一 个 称 为 ParallelFunction 的 
例 程 ，ParallelFunction 例 程 定义 了 并 行 执 行 的 独立 任务 。 当 程序 开始 执行 时 ， 只 有 一 个 线程 
执行 主 程序 。 这 个 线程 初始 化 向 量 ， 然 后 初始 化 屏障 同步 所 需 的 共享 变量 。 为 了 启动 并 行 执 
行 ， 需 要 在 主 程序 中 调用 己 1 次 create _ thread 例 程 来 创建 额外 的 线程 ， 其 中 每 一 个 线程 都 执行 
ParalleFunction。 然 后 ， 执 行 主 程序 的 线程 直接 调用 ParallelFunction， 使 得 P 个 线程 都 参与 到 
整体 计算 中 。 操 作 系 统 软件 负责 将 线程 分 布 到 不 同 的 处 理 器 上 并 行 执行 。 

每 个 线程 都 需要 从 ParallelFunction 中 调用 get my thread id 来 获得 一 个 介 于 0 至 已 1 之 
间 的 唯一 整数 。 利 用 此 信息 ， 线 程 可 以 为 生成 其 部 分 和 的 循环 计算 开始 和 结束 标志 。 执 行 完 
环 后 ， 线 程 会 使 用 它 唯 一 的 标识 符 作 为 数组 的 索引 ， 将 结果 写 人 到 共享 数组 partial sums 中 一 
个 单独 的 元 素 中 。 然 后 ， 线 程 调用 屏障 同步 库 例 程 来 等 待 其 他 的 线程 完成 计算 。 
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最 后 一 个 线程 完成 其 计算 调用 屏障 例 程 后 ， 所 有 的 线程 将 返回 到 ParallelFunction， 而 在 
ParallelFunction 中 没有 进一步 的 计算 了 ， 因 此 这 P-1 个 在 主 程序 中 由 库 调 用 创建 的 线程 都 终止 
运行 。 从 主 程序 中 直接 调用 ParallelFunction 的 线程 会 返回 ， 并 使 用 partial_sums 数组 中 的 值 来 
计算 最 终结 果 。 

图 12-8 中 的 程序 使 用 通用 的 库 例 程 来 说 明 线 程 的 创建 和 同步 。IEEE 1003.1 标准 [4] 中 定 
义 了 C 语言 中 并 行 编程 的 一 个 例 程 集合 ， 这 个 集合 也 被 称 为 POSIX 线程 或 Pthreads 库 ， 它 提 
供 了 多 种 线程 管理 和 同步 的 机 制 。 这 个 库 的 实现 可 用 于 各 种 广泛 使 用 的 操作 系统 中 ， 以 方便 多 
处 理 器 编程 。 


#include <stdio.h> 人 # 输 入 /输出 例 程 */ 
#include "threads.h" 上 # 线程 创建 / 同步 例 程 */ 


#define N 100 履 每 个 向 量 中 的 元 素数 */ 
#define P 4 /* 并 行 执行 的 处 理 器 数 */ 


double a[N], b[N]: /* 用 于 计算 点 积 的 向 量 */ 
double ”partial_sums[P]; /# 由 线程 计算 的 结果 数组 */ 
Barrier bar; 履 支持 屏障 同步 的 共享 变量 */ 


void ParallelFunction (void) 
{ 
int my_id, i, start, end; 
double s; 


my_id = get_my_thread_id (); 入 获取 线程 的 唯一 标识 符 */ 
start = (N/P) * my_id; 上 使 用 线程 标识 符 确定 其 开始 /结束 */ 
end= (NMP)* (my_id+l)-1 /* 假设 和 N 可 被 PP 整除 */ 
s=0.0; 
for (i = start; 1 <= end; i++) 
s=s+a[li]* bl[i]; 
partial_sums[my_id] = s; 将 结果 保存 到 数组 中 */ 
barrier (&bar, P); 证 与 其 他 线程 同步 */ 


main (void) 


int i; 
double dot_product; 


< Initialize vectors a[], b[] - details omitted.> 
init_barrier (&bar); 
for(i=1;i< P;i++) * 创 建 P-1 个 额外 的 线程 */ 
create_thread (ParallelFunction); 
ParallelFunction(); /# 主线 程 也 加 入 并 行 执行 */ 
dot_product = 0.0; /# 屏障 同步 后 ， 计 算 最 终结 果 */ 
for(i =0;1< P; i++) 
dot_product = dot_product + partial _sums[i]; 
printf (“The dot product is %g\ n", dot_product); 





图 12-8 计算 点 积 的 并 行 C 程序 


12.7 ”性 能 建 模 


衡量 一 台 计 算 机 性 能 最 重要 的 方式 是 看 它 执 行程 序 的 速度 有 多 快 。 在 考虑 一 个 处 理 器 时 ， 
其 指令 的 读 取 和 执行 速度 是 受 指 令 集体 系 结构 和 硬件 设计 的 影响 的 ， 执 行 的 指令 总 数 是 受 编译 


第 12 章 并 行 处 理 及 性 能 + 301 


器 以 及 指令 集体 系 结构 的 影响 的 。 第 6 章 介绍 了 基本 的 性 能 等 式 ， 这 是 一 个 低级 的 数学 模型 ， 
它 反映 了 一 个 处 理 器 的 上 述 考虑 因素 。 在 该 模型 中 的 术语 包括 执行 的 指令 数 、 每 条 指令 的 平均 
周期 数 以 及 时 钟 频率 。 该 模型 给 出 了 足够 详细 的 信息 使 得 执行 时 间 可 被 预测 。 

有 一 个 更 高 级 的 模型 ， 它 可 根据 较 少 的 详细 信息 来 评估 潜在 的 性 能 提升 情况 。 考 虑 一 个 
程序 ， 它 在 某 台 计算 机 上 的 执行 时 间 为 Tuas。 我 们 的 目标 是 评估 当 引 入 诸如 并 行 处 理 这 样 的 性 
能 增强 方式 时 执行 时 间 可 减少 的 程度 。 假 定 执行 时 间 的 一 小 部 分 As 会 受 性 能 增强 的 影响 ， 而 
其 余 的 部 分 fincwm= 1-fcms 是 不 变 的 。 假 设 p 表示 部 分 时 间 As x Tunas 由 于 性 能 增强 而 减少 的 因子 ， 
则 新 的 执行 时 间 为 

Thew = Torig (funenh 十 jeoh 力 ) 
加 速 比 (speedup ) 为 TaiwTaew 或 者 
1/ ( finenn + fenn /PD) 
上 面 加 速 比 的 表达 式 被 称 为 Amdahl 定律 (Amdahbs Law )， 它 是 以 第 一 个 正式 提出 上 述 推 理 
的 Gene Amdahl 来 命名 的 。 如 果 某 种 性 能 增强 可 以 影响 大 部 分 的 执行 时 间 ， 那 么 该 定律 可 以 直 
观 地 判断 其 收益 的 增加 情况 。 

当 确定 了 原始 执行 时 间 中 可 增强 部 分 的 比例 后 ， 就 可 用 该 定律 确定 可 能 的 加 速 比 上 限 。 
我 们 使 用 p 一 % 来 反映 执行 时 间 的 jw 部 分 减少 到 零 的 理想 情况 ， 但 这 是 不 现实 的 。 由 此 得 到 
的 加 速 比 是 1anous， 这 意味 着 没有 增强 的 执行 时 间 部 分 是 性 能 的 限制 性 因素 。 一 个 较 小 的 As 
值 可 提供 一 个 较 大 的 加 速 比 上 限 。 例 如 ，fisem= 0.1 给 出 的 上 限 为 10， 但 femm=0.05 给 出 的 上 限 
则 为 20。 然 而 ， 使 用 一 个 实际 的 p 值 时 预期 的 加 速 比 往 往 远 低 于 上 限 。 例 如 ，p=16 而 fscnr = 
0.05 时 加 速 比 只 有 1/( 0.05+0.95/16 ) = 9.1， 远 低 于 上 限 20。 

本 次 讨论 的 重要 结论 是 : 原 有 执行 时 间 的 未 增强 部 分 会 大 大 限制 可 实现 的 加 速 比 ， 即 使 可 
增强 部 分 能 够 提高 任意 倍数 。 如 果 在 采用 特定 的 增强 措施 之 前 ， 一 个 程序 员 可 以 ， 即 便 是 只 
大 致 地 确定 执行 时 间 的 ficnn 种 部分， 那么 Amdahl 定律 就 可 以 为 预期 的 性 能 改善 提供 有 益 的 
见解 。 利 用 这 些 信息 可 以 确定 预期 的 性 能 收益 是 否 值 得 为 实现 性 能 增强 所 付出 的 努力 和 代价 。 


12.8 ”结束语 


流水 线 和 高 速 缓存 这 样 的 基本 技术 是 提高 性 能 的 重要 途径 ， 它 们 被 广泛 应 用 于 计算 机 编 
程 中 。 多 线程 、 向 量 ( SIMD ) 处 理 和 多 重 处 理 等 技术 通过 更 有 效 地 利用 处 理 资源 和 并 行 执行 
多 个 操作 可 进一步 改善 性 能 。 这 些 技术 已 被 应 用 到 通用 多 核 处 理 器 芯片 中 。 


习题 

[M] 12.1 假设 总 线 传输 需要 7 了 秒 ， 存 储 器 访问 时 间 为 47 秒 。 一 个 经 过 传统 总 线 的 读 请 求 需要 67 秒 完 
成 。 在 相同 的 时 间 延 迟 下 ,需要 多 少 根 传统 的 总 线 才能 等 于 或 超过 分 割 事务 总 线 的 有 效 吞 吐 
量 ? 只 考虑 读 请 求 ， 忽 上 略 存 储 器 冲突 ， 并 假定 所 有 的 存储 模块 都 连接 到 多 总 线 中 的 所 有 总 线 上 。 
如 果 存 储 器 访问 时 间 增 加 的 话 ， 你 的 答案 是 增加 还 是 减少 ? 

[M] 12.2 假设 一 个 计算 包括 K+1 个 不 同 的 任务 ,为 了 编写 一 个 程序 来 实现 所 需 的 计算 ， 用 C 语言 将 每 一 
个 任务 都 编写 成 一 个 函数 ,对 1 个 函数 分 别 是 T00、T10 、…、TkO。 执 行 每 个 函数 需要 zt 个 时 
间 单 位 。 由 于 数据 依赖 关系 ， 函 数 T10 到 Tk() 必须 在 T00 之 后 执行 ， 而 函数 T10 到 TKO 之 间 
(a3 使 用 给 定 的 函数 ， 写 一 个 在 单 处 理 器 上 运行 的 C 程序 。 
(b ) 写 一 个 等 价 的 C 程序 , 但 可 以 在 个 处 理 器 上 运行 。 
(c ) 推导 出 (b ) 部 分 中 的 程序 相对 于 (a ) 部 分 中 的 程序 的 理想 加 速 比 表达 式 。 
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[D] 12.3 在 保持 高 速 绥 存 一 致 性 中 支持 和 反对 无 效 策略 与 修改 策略 的 观点 分 别 是 什么 ? 

[D] 12.4 共享 存储 器 和 消息 传递 方法 都 支持 相互 交互 的 任务 同时 执行 。 这 两 种 方法 中 哪 一 种 方法 更 容易 
仿真 另外 一 种 方法 ? 简要 说 明 你 的 理由 。 

[E] 12.5 参考 图 12-1， 假 设 一 个 数组 的 大 小 N =32。 在 处 理 器 中 执行 每 一 条 指令 都 需要 一 个 时 间 单 位 ， 
请 计算 向 量 长 度 为 4、8、16 和 32 时 的 向 量化 加 速 比 。 

[M] 12.6 对 于 向 量化 ， 效 率 被 定义 为 加 速 比 和 向 量 长 度 的 比率 。 请 计算 习题 12.5 中 每 个 结果 的 效率 。 根 
据 向 量 长 度 评论 效率 的 变化 。 

[M] 12.7 在 图 12-8 中 计算 点 积 的 并 行程 序 中 ， 所 有 线程 都 到 达 屏 障 后 ， 由 一 个 处 理 器 来 计算 所 有 部 分 积 
的 和 。 修 改 程序 ， 使 得 每 个 线程 都 将 其 部 分 和 递增 地 累加 到 点 积 的 一 个 全 局 和 中 。 为 了 防止 两 
个 或 多 个 线程 试图 同时 修改 全 局 和 ， 需 要 采用 同步 机 制 。 一 种 方法 是 使 用 一 个 共享 的 计数 器 变 
量 ， 其 值 是 被 授权 独占 访问 全 局 和 变量 的 线程 标识 符 。 在 线程 独占 访问 并 更 新 了 全 局 和 之 后 ， 
它 可 以 简单 地 增加 这 个 计数 器 的 值 ， 以 将 独占 访问 权 授予 另 一 个 线程 。 

[E] 12.8 假设 一 个 多 处 理 器 系统 中 有 8 个 处 理 器 。 根 据 在 一 个 处 理 器 上 运行 的 现 有 程序 ， 编 写 一 个 并 行 
程序 使 其 在 该 多 处 理 器 系统 上 和 运行。 假设 程序 并 行 部 分 的 工作 量 可 以 均匀 地 分 布 在 这 8 个 处 理 
器 上 。 使 用 Amdahl 定律 来 计算 加 速 比 为 5 时 jc 的 值 。 
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逻辑 电路 





附录 目标 

本 附录 简要 介绍 迪 辑 电路 ， 你 将 学 习 以 下 内 容 : 

e 逻辑 隐 数 的 组 合 

e 触发 器 、 寄 存 器 和 计数 器 

e 译 码 器 和 多 路 复 用 器 

e 有 限 状态 机 

e 可 编程 逻辑 需 件 

e 逻辑 电路 的 实现 

数字 计算 机 中 的 信息 是 由 称 为 远 辑 电路 (logic circuit ) 的 电子 网 络 表 示 和 处 理 的 。 这 些 电 
路 对 二 进 制 变量 进行 操作 ， 我 们 可 以 为 二 进 制 变 量 (binary variable ) 赋 两 个 不 同 的 值 ， 通 常 是 
0 和 1。 本 附录 将 对 逻辑 晒 数 和 实现 电路 做 简要 摘 述 ， 并 对 集成 电路 技术 做 简单 介绍 。 


A.1 基本 逻辑 函数 

下 面 用 一 个 每 个 家 庭 都 会 遇 到 的 实际 问题 来 介绍 二 进 制 逻 辑 。 来 看 一 个 由 两 个 开关 x1、 
控制 的 灯泡 。 每 个 开关 都 只 有 两 个 位 置 : 0 或 1， 如 图 A-la 所 示 ， 这 样 就 可 以 用 一 个 二 进 制 变 
量 表示 开关 ， 我 们 将 开关 的 名 称 作 为 其 对 应 二 进 制 变量 的 名 称 。 图 中 还 有 一 个 电源 和 一 个 灯 
泡 。 开 关 端 口 的 连接 方式 决定 了 开关 控制 灯 的 方式 。 只 有 存在 一 个 从 电源 经 开关 网 络 到 灯泡 
的 闭合 回路 时 ， 灯 才 会 亮 。 我 们 用 二 进 制 变量 表示 灯 的 状态 。 如 果 灯 亮 ,f= 1; 如 果 灯 不 亮 ， 
f=0。 这 样 ,f= 1 说 明 电路 中 至 少 有 一 个 闭合 回路 ; 而 f=0 说 明 没 有 闭合 回路 。 显 然 , f 是 变 
量 x 和 ww 的 也 数 。 

下 面 看 一 些 控制 灯 状态 的 可 能 情况 。 首 先 ， 假 设 任 一 开关 在 1 的 位 置 时 灯 都 会 亮 ， 即 当 


Xi=1 且 =0 
或 

x1=0 有 日 x=1 
或 

xI=1 且 x;=1 
时 , /=1。 


实现 这 种 控制 的 电路 连接 方式 如 图 A-lb 所 示 。 电 路 图 旁 的 逻辑 真 值 表 ( truth table ) 表示 
了 这 一 情况 。 表 中 列 出 了 所 有 可 能 的 开关 状态 及 在 每 个 状态 下 的 f 值 。 在 逻辑 术语 中 ， 这 个 表 
格 表示 了 两 个 变量 和 x 的 “或 ”( OR ) 函数 。 这 个 操作 在 代数 中 用 符号 “+” 或 符号 “V” 
表示 ， 即 

f=xit+x2=x! V x 

我 们 称 x,、x; 为 输入 input ) 变量 , f 为 输出 (output ) 函数 。 

下 面 是 OR 操作 的 一 些 基 本 性 质 。 它 是 可 交换 的 ， 即 

Xi 十 和 一 各 十 Xi 


这 一 性 质 可 扩展 到 n 个 变量 中 ， 即 
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d) 异 或 联接 (“ 异 或 ”控制 ) 
图 A-1 电灯 开关 示例 


i a 2 We 填 守 寺 允 
如 果 任 意 一 个 x 的 值 为 1, f 的 值 就 为 1。 这 反映 了 在 图 A-lb 中 的 两 个 开关 上 并 联 更 多 开关 时 
的 效果 。 而 且 ， 通 过 观察 真 值 表 可 以 看 出 
1+x=1 
0+x=x 
现在 ,假设 只 有 当 两 个 开关 都 在 1 的 位 置 时 灯 才 会 亮 。 这 个 状态 的 电路 连接 和 相应 的 真 
值 表 表示 如 图 A-1c。 这 种 情况 为 “与 ”( AND ) 操作 ,使 用 符号 “。” 或 “人 ”表示 。 即 
f=xi*x2=x1 MN x 
“与 ”操作 的 一 些 基 本 性 质 有 
X1®° X72 = X2° Xl 
1。X 三 X 
0。x=0 
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“与 ”函数 也 可 扩展 到 壮 个 变量 ， 即 
f=xX1® x2 A 
上 式 只 有 当 所 有 的 x 变量 都 为 1 时 才 得 1。 这 反映 了 在 图 A-lc 中 两 个 开关 上 串联 更 多 的 开关 
时 的 情况 。 
最 后 要 讨论 的 这 种 控制 灯 状 态 的 开关 方式 是 另 一 种 常见 的 情况 。 假 设 走廊 的 两 端 都 有 开 
关 ， 每 个 开关 都 应 该 能 控制 灯 的 开 或 关 。 即 : 如 果 灯 是 亮 的 ， 改 变 任 一 个 开关 的 位 置 都 应 将 其 
关闭 ; 而 如 果 灯 是 灭 的 ， 改 变 任 一 个 开关 的 位 置 都 应 将 其 打开 。 假 设 两 个 开关 都 在 0 位 置 时 ， 
灯 是 灭 的 。 那 么 将 任 一 个 开关 置 为 1 都 能 将 灯 打 开 。 现 在 假定 灯 是 亮 的 ， 且 xi= 1, x;=0。 显 
然 将 开关 x 变 为 0 可 以 把 灯 关 闭 。 此 外 ,将 x 置 为 1 也 应 该 能 将 灯 关 闭 ， 即 当 xi = x; = 1 时， 
f=0。 实 现 这 种 控制 的 电路 如 图 A-1d 所 示 。 相 应 的 四 辑 操作 称 为 “ 异 或 ”(XOR,， 
EXCLUSIVE-OR ) 操作 ， 使 用 符号 “ 申 ” 表 示 。 它 的 性 质 有 
KORN=n OA 
1 Bx=x 
0@Ox=x 
其 中 x 代表 x 的 “ 非 ”( NOT ) 操作 。 单 变量 的 函数 /=z ， 当 x=0 时 取 1， 当 x=1 时 取 0。 我 
们 称 输 入 x 被 取 反 (inverted ) 或 求 补 ( complemented ) 了 。 


电子 逻辑 门 

使 用 闭合 或 断 开 电 路 的 开关 以 及 灯泡 来 说 明 逻 辑 变 量 和 函数 的 思想 是 非常 形象 和 方便 的 。 
前 面 介绍 的 逻辑 概念 同样 适用 于 数字 计算 机 中 处 理 信息 的 
电子 电路 。 但 物理 变量 是 电路 的 电 平和 电流 ， 而 不 是 开关 一) 7-ara 
的 位 置 以 及 闭合 或 断 开 的 电路 。 例 如 ， 考 虑 一 个 电路 , 其 “ “可 
输入 电 平 为 +5 伏 或 0 伏 。 电 路 输出 电 平 同样 是 +5 伏 或 0 


伏 。 现 在 ， 如 果 用 +5 伏 代 表 逻 辑 1，0 伏 代 表 逻 辑 0， 那 "二 | )— me 

么 就 可 以 指定 该 电路 逻辑 操作 的 真 值 表 ， 从 而 描述 电路 的 ” 志 v0 

作用 。 与 门 
借助 于 晶体 管 ， 我 们 可 以 设计 出 简单 的 电路 完成 与 、 

或 、 异 或 以 及 非 操 作 。 习 惯 上 将 这 些 基 本 逻辑 电路 称 为 门 < 一 声 * 一 站 宇 返 

( gate )。 图 A-2 给 出 了 这 些 门 的 标准 符号 。 在 逻辑 门 的 输入 非 门 

或 输出 反 相 时 ， 我 们 使 用 一 种 更 为 紧凑 的 图 形 记 号 来 表示 


非 操作 ， 即 用 一 个 小 圆圈 表示 。 “一 > 一 -sex 
逻辑 门 的 电路 实现 将 在 A.5 节 中 进行 讨论 。 接 下 来 继 “ 


续 讨 论 怎样 使 用 逻辑 门 构造 一 些 具有 更 复杂 逻辑 功能 的 逻 ee 
辑 网 络 。 图 A-2 标准 逻辑 门 符号 


A.2 逻辑 函数 的 组 合 
考虑 图 A-3a 中 由 两 个 与 门 和 一 个 或 门 组 成 的 网 络 。 它 可 以 用 下 面 的 式 子 表示 
fxi* Xst x1* Xo 
图 A-3b 是 这 个 表达 式 的 真 值 表 。 首 先 ， 与 门 的 值 由 每 个 输入 值 决 定 。 而 函数 了 的 值 由 或 操作 
决定 。/ 的 真 值 表 与 异 或 函数 的 真 值 表 一 样 ， 所 以 图 A-3a 使 用 与 门 、 或 门 和 非 门 实现 了 异 或 函 
数 。 逻 辑 表示 式 .x+x。Dm 称 为 积 之 和 ( sum-of-product ) 的 形式 ， 因 为 OR 操作 有 时 被 称 作 
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“和 ”函数 ， 而 AND 操作 被 称 作 “ 积 ” 哺 数 。 


需要 注意 的 是 ， 为 了 说 明 执行 操作 的 顺序 ， 将 表达 式 写 为 1= (()，x) + ( 交 * 合 ) ) 更 为 


合适 。 为 了 简化 表达 式 ， 我 们 需要 对 与 、 或 、 非 
三 种 操作 的 优先 级 进行 定义 。 在 没有 圆 括号 时 ， 
逻辑 表达 式 的 操作 应 当 按照 以 下 顺序 执行 : 非 、 
与 ， 然 后 是 或 。 此 外 ， 在 不 产生 歧义 的 情况 下 习 
惯 上 省 略 “ ”运算 符 。 

回 到 积 之 和 的 形式 ， 我们 现在 解释 如 何 直接 
从 真 值 表 推导 出 任意 逻辑 函数 的 积 之 和 形式 。 考 
虑 表 A-1 中 的 真 值 表 ， 并 假设 函数 fi 用 与 门 、 或 
门 、 非 门 组 成 。 对 于 表 中 .f= 1 的 每 一 行 ， 都 引入 
积 之 和 形式 中 的 一 个 乘积 (与 ) 项 。 这 个 乘积 项 
包括 所 有 三 个 输入 变量 。 非 操作 作用 在 单个 变量 
上 ， 使 得 只 有 当 这 些 变量 取 与 真 值 表 的 那 一 行 对 
应 的 某 个 确定 值 时 ， 乘 积 项 才 为 1。 这 表明 如 果 
5=0， 则 无 就 在 乘积 项 中 ;， 如 果 坟 = 1， 则 x 在 乘 
积 项 中 。 例 如 ， 表 中 第 4 行 的 函数 值 为 1， 而 输入 
变量 为 

(xl x2, X3) = (0, 1, 1) 

则 相应 的 乘积 项 是 xxxx3。 将 所 有 fi 为 1 的 
行 都 进行 同样 的 操作 ， 得 到 

= 和 X3+ XI Ky X3t XI XX 3+ XI X2 X3 

与 这 一 表达 式 相 对 应 的 逻辑 网 络 在 
图 A-4 的 左 方 。 异 或 函数 的 积 之 和 表达 式 
也 可 以 使 用 这 个 方法 由 其 真 值 表 导 出 。 这 
个 方法 可 以 从 任意 大 小 的 真 值 表 导出 积 之 
和 表达 式 以 及 相应 的 逻辑 网 络 。 


f1 = XI1X2X3 十 天 1X2X3 十 区 1XOX3 十 XXX2X3 





f =I"x +Xx) Ty 


a) 异 或 师 数 网 络 





b)xiexra+xiseXxa 的 真 值 表 
图 A-3 使 用 与 门 、 或 门 和 非 门 实 现 异 或 函数 
表 A-1 两 个 3 变量 函数 





f1 = XIX2 + XoX3 


图 A-4 表 A-1 中 /的 逻辑 网 络 及 与 其 等 价 的 最 小 网 络 
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A.3 ”逻辑 表达 式 的 化 简 

前 面 介 绍 了 如 何 从 真 值 表 导出 一 个 积 之 和 表达 式 。 实 际 上 ， 对 于 任意 一 个 特定 的 真 值 表 
都 有 许多 等 价 的 表达 式 和 逻辑 网 络 。 两 个 逻辑 表达 式 或 逻辑 门 电路 如 果 具 有 相同 的 真 值 表 ， 那 
么 它们 就 是 等 价 的 。 与 上 一 节 导 出 的 fi 的 积 之 和 表达 式 等 价 的 一 个 表达 式 是 

XIX2+ X2X3 

要 证 明 这 一 点 ， 我 们 需要 列 出 这 个 简单 表 A-2 表达 式 x 双 + xzxs 的 真 值 表 
表达 式 的 真 值 表 ( 表 A-2)， 并 指出 它 与 
表 A-1 中 有 几 函数 的 真 值 表 是 相同 的 。 创 建 
ziXzt+ x2x3 真 值 表 的 过 程 分 为 三 步 。 首 先 ， 
计算 每 种 输入 值 下 乘积 项 的 值 。 然 后 ， 
计算 乘积 项 zx 。 最 后 ， 将 这 两 列 相 “或 ” 
得 到 表达 式 的 真 值 表 。 这 个 真 值 表 与 表 A-l 
中 的 fi 函数 真 值 表 完 全 一 致 。 

为 了 简化 逻辑 表达 式 ， 我 们 进行 一 系 
列 的 代数 操作 。 在 这 些 操作 中 ， 我 们 使 用 
了 新 的 逻辑 规则 : 分 配 律 





WwWw (+2z)=VyY 十 WZz 
和 恒等式 
w+w=1 

表 A-3 给 出 了 分 配 律 的 真 值 表 证 明 。 现 在 应 该 清楚 ， 像 这 样 的 规则 总 是 可 以 通过 列 出 其 左边 和 
右边 的 真 值 表 ， 然 后 指出 它们 相同 的 方式 来 证 明 。 钦 辑 规则 如 分 配 律 有 时 称 为 恒等式 。 尽 管 在 。”[472] 
这 里 用 不 到 ， 但 为 了 完整 性 ， 再 给 出 分 配 律 的 另 一 种 形式 : 

w+tyz= (w+y) (w+2) 

表 A-3 ” 真 值 表 方法 证 明 表达 式 等 价 


等 号 左边 等 号 右边 
y+z w(y + Zz) WY wy + wz 
oo | 





|--|-|-|olololo|l 


-|ol-~-|o|l-|o|l-|loln 
||-~-|ioclololeo 


逻辑 化 简 的 目的 是 根据 一 些 标准 减少 实现 特定 逻辑 函数 的 成 本 。 特 别 地 ， 我 们 希望 从 由 
真 值 表 导 出 的 积 之 和 表达 式 开 始 ， 将 它 化 简 为 最 小 积 之 和 ( minimal sum-of-products ) 表达 式 。 
为 了 定义 化 简 的 标准 ， 有 必要 引入 一 个 衡量 积 之 和 表达 式 的 大 小 或 成 本 的 量度 。 通 常 成 本 量度 
是 以 图 A-4 的 形式 实现 表达 式 所 需 的 门 和 门 输入 的 总 数 。 例 如 ， 图 中 较 大 的 表达 式 成 本 为 21， 
由 5 个 门 和 16 个 门 输入 组 成 。 在 计数 过 程 中 忽略 了 输入 的 反 相 。 较 小 的 表达 式 成 本 为 9， 由 3 
个 门 和 6 个 门 输入 组 成 。 现 在 可 以 明确 ， 如 果 没 有 其 他 等 价 的 积 之 和 表达 式 具有 更 小 的 成 本 ， 
那么 这 个 积 之 和 表达 式 就 是 最 小 的 。 下 面 所 举 的 简单 例子 可 以 清楚 地 看 出 我 们 得 到 了 最 小 的 表 
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达 式 。 因 此 不 再 给 出 最 小 化 的 严格 证 明 。 
简化 一 个 给 定 表达 式 的 一 般 算术 操作 如 下 。 首 先 ， 将 在 一 个 乘积 项 中 为 反 (Xx)， 而 在 男 一 
个 乘积 项 中 为 真 (x )， 并 且 其 他 变量 相同 的 项 两 两 分 组 。 根 据 分 配 率 ， 提 出 由 其 他 变量 组 成 的 
公共 乘积 子 项 后 ， 则 剩 下 x+ 区 项 ， 其 值 为 1。 对 第 一 个 的 表达 式 应 用 这 一 操作 ,我们 得 到 : 
fi = XIX2X3 + XIXaX3 十 无 2f2X3 + XIXXI 
= XX(X3 + X3) + (Kl + X12x3 
= XiX2* |] 十 1 xoxs 
= XIX2 十 X2X3 
这 个 表达 式 是 最 小 的 。 相 应 的 网 络 连接 如 图 A-4 所 示 。 
将 乘积 项 成 对 分 组 得 到 最 简 表 达 式 的 最 小 化 过 程 并 不 总 是 像 前 面 例 子 那样 明显 。 一 个 很 
有 用 的 规则 是 
w+w=w 
这 个 规则 人 允许 我 们 重复 使 用 乘积 项 ， 从 而 在 提取 公 因 式 的 过 程 中 ， 某 个 乘积 项 可 与 其 他 多 个 项 
组 合 。 举 个 例子 ， 看 一 下 表 A-1 中 的 函数。 其 积 之 和 表达 式 可 直接 由 真 值 表 导 出 为 
f= XIXoX3 + KiXaX3 + XIXIX3 + XIX2X3 + XIXX3 
通过 重 写 第 一 个 乘积 项 xox3 并 交换 项 的 位 置 ( 根据 交换 律 )， 我 们 得 到 
fh = XXaxy + XXX3 + XIXX3 + XTX3 + XIX2X3 + XIXIX3 
将 乘积 项 结对 并 提取 公 因 子 ， 得 到 
f= XxX + X3) + XiX2(K3 + X3) + KI(X2 + Xo)x 
= XX2 十 XIX2 + XIX3 
现在 ， 通 过 因 式 分 解 化 去 前 两 项 ， 得 到 最 小 表达 式 
f= Tt Xx 
这 样 就 完成 了 我 们 对 逻辑 表达 式 的 算术 化 简 表 A-4 二进制 逻辑 规则 
的 讨论 。 这 项 数学 练习 的 实际 意义 是 显 而 易 
见 的 ， 由 较 少 的 门 和 输入 构成 的 网 络 更 加 和 
廉价 并 且 易于 实现 。 因 此 ， 确 定 与 所 给 表达 。 结合 (ww) = wz) 
式 等 价 的 最 简 表达 式 符合 经 济 利益 的 需要 。 分 本 w+ Wy + 
表 A-4 中 总 结 了 操作 逻辑 表达 式 时 应 用 的 规 
则 。 它 们 成 对 出 现 ， 显 示 出 “与 ”和 “或 ” 
函数 的 对 称 性 。 到 目前 为 止 ， 我 们 还 没有 机 
会 使 用 对 合 律 或 德 摩根 律 ， 但 是 在 下 一 节 中 
会 发 现 它 们 很 有 用 。 
A.3.1 使 用 卡 诺 图 化 简 
在 对 表 A-1 中 的 函数 fi 和 J, 进行 代数 化 简 的 过 程 中 ， 有 些 时 候 必 须 猜 测 最 佳 的 处 理 方 
法 。 例如， 在 了 ; 的 化 简 中 判断 第 一 步 重 写 项 去 x 并 不 明显 。 有 一 种 几何 方法 可 以 迅速 地 导 
出 含有 几 个 变量 的 逻辑 函数 的 最 小 表达 式 ， 这 依赖 于 真 值 表 的 另 一 种 表示 形式 ， 称 为 卡 诺 图 
( Karnaugh map )。 对 于 一 个 3 变量 函数 ， 它 是 一 个 由 2 行 4 列 共 8 个 方块 组 成 的 长 方形 ， 如 
图 A-5a 所 示 。 每 个 方块 对 应 于 输入 变量 的 一 组 特定 的 值 。 例 如 ， 第 一 行 的 第 三 个 方块 表示 值 
Go 2, Xa) = (1, 1, 0) 。 因 为 3 变量 的 真 值 表 为 8 行 ， 所 以 卡 诺 图 显然 需要 8 个 方块 方块 中 的 
内 容 是 与 输入 变量 值 相 对 应 的 函数 值 。 
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构建 卡 诺 图 的 关键 思想 是 水 平和 垂直 相 邻 的 方块 对 应 着 只 有 一 个 变量 不 同 的 输入 变量 值 。 
当 两 个 相 邻 的 方块 值 都 为 1 时 ， 表 明 可 以 进行 代数 化 简 。 在 图 A-5a 函数 的 卡 诺 图 中 ， 第 一 
行 最 左边 的 两 个 值 为 1 的 方块 与 乘积 项 双 x3、zixoxt 对 应 。 在 最 小 化 有 代数 表达 式 过 程 中 先 执 
行 化 简 





无 ] X2 Xa3t+ XI X2 X3= 无 ] Xs 

将 图 中 的 两 个 1 格 圈 为 一 组 就 可 以 直接 得 到 化 简 结果 。 与 一 组 方块 相对 应 的 乘积 项 是 在 这 些 方 
块 中 值 不 变 的 那些 输入 变量 的 乘积 。 如 果 x 在 一 组 1 格 中 的 值 为 0， 则 将 元 加 入 乘积 项 ， 如 
果 x 的 值 是 1， 则 将 x; 加 入 乘积 项 。 两 方块 相 邻 的 情况 还 包括 最 左 端 的 方块 与 最 右 端 的 方块 
相 邻 。 继 续 我 们 对 f 的 讨论 ， 由 最 左 列 和 最 右 列 组 成 的 4 个 1 格 的 组 化 简 得 到 单一 变量 项 
五 ， 因 为 x; 是 该 组 中 唯一 一 个 值 不 变 的 变量 。 其 他 两 个 变量 的 所 有 4 种 可 能 的 组 合 都 在 该 组 
中 出 现 过 了 。 

卡 诺 图 可 以 用 于 多 于 3 个 变量 的 情况 。4 变量 的 卡 诺 图 可 以 由 两 个 3 变量 的 卡 诺 图 得 到 。 
图 A-5b 是 4 变量 卡 诺 图 的 例子 ， 同 时 还 给 出 了 图 中 表示 的 函数 的 最 小 表达 式 。 除 了 2 个 方块 
和 4 个 方块 的 组 外 ， 现 在 还 可 以 组 建 8 个 方块 的 组 。 这 样 的 分 组 在 8 的 图 中 有 所 显示 。 注 意 
8 中 角 上 的 4 个 方块 也 构成 了 一 个 合法 的 4 格 组 ， 代 表 乘 积 项 丈 z。 与 3 变量 的 图 一 样 ， 与 一 
组 方块 所 对 应 的 项 是 组 中 没有 改变 值 的 变量 乘积 。 例 如 8 图 中 右上 角 的 4 格 组 表示 为 乘积 项 
Xx， 因为 组 中 x = 1， 为 = 0。 该 组 中 包含 了 变量 与 x4 所 有 可 能 的 取 值 组 合 。 对 于 5 变量 函 
数 也 可 以 使 用 卡 诺 图 。 在 这 种 情况 下 ， 将 使 用 两 个 4 变量 卡 诺 图 ， 其 中 一 个 对 应 于 第 5 个 变量 
取 0 的 情况 ， 另 一 个 对 应 取 1 的 情况 。 

在 卡 诺 图 中 划分 2 格 组 、4 格 组 、8 格 组 等 的 一 般 方法 可 以 很 容易 地 得 出 。 两 个 相 邻 的 值 
为 1 的 对 可 以 组 合 为 一 个 4 格 组 。 类 似 地 ， 两 个 相 邻 的 4 格 组 可 以 组 成 一 个 8 格 组 。 通 常 ， 任 
意 有 效 组 中 方 格 的 个 数 一 定 为 2， 其 中 为 整数 。 

我 们 现在 考虑 使 用 卡 诺 图 得 到 最 小 积 之 和 表达 式 的 过 程 。 从 图 A-5 中 可 以 看 出 ， 大 的 组 
对 应 于 小 的 乘积 项 。 因 此 ， 要 得 到 简单 门 电路 ， 应 该 尽量 用 最 少 的 组 覆盖 图 中 所 有 的 1。 一 般 
说 来 ,我们 应 当 使 用 最 少 的 组 ， 并 且 每 个 组 都 尽 可 能 的 大 ， 来 覆盖 所 有 的 1。 例 如， 考虑 
图 A-5b 中 的 函数 gp。 如 图 所 示 ， 四 个 角 上 值 为 1 的 方块 组 成 了 表示 乘积 项 去 的 组 。 另 一 个 
4 格 组 在 右上 角 ， 表 示 乘 积 项 xz3。 这 两 个 组 包括 了 除 位 置 为 Co x, x3, Xa) = (0, 1, 0, 1) 外 所 有 
值 为 1 的 方块 。 包 含 这 个 方块 的 最 大 的 组 是 一 个 2 格 组 ， 表 示 乘 积 项 xzxyxs 。 因 此 ，g; 的 最 小 
表达 式 是 


加 天 Xz2 Xat XI X3tX2 X3 Xa 





f1 = XI1X2 + X2X3 


a ) 3 变量 图 
图 A-5 使 用 卡 诺 图 进行 化 简 
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83 = XA + XoX3 &4 三 XI XIX3 十 X2X3X4 + 或 
b ) 4 变量 图 
图 A-5 ( 续 ) 


图 中 其 他 函数 的 最 小 表达 式 可 使 用 类 似 方法 得 到 。 注 意 g; 有 两 种 可 能 的 最 小 表达 式 ， 一 个 包 
括 区 xxxa 项 ， 男 一 个 包括 Xx 项 。 这 种 给 定 的 函数 有 不 止 一 个 最 小 表达 式 的 情况 经 常 出 现 。 

在 我 们 给 出 的 所 有 例子 中 ， 得 到 最 小 表达 式 都 比较 容易 。 通 常 这 一 过 程 有 正式 的 算法 ， 
但 这 里 不 再 讨论 。 
A.3.2 无 关 项 条 件 

在 许多 情况 下 ， 数 字 电 路 的 一 些 输入 值 永 远 都 不 会 出 现 。 例 如 ， 考 虑 二 进 制 编码 的 十 进 
制 数 ( BCD ) 表示 法 。 四 个 二 进 制 变量 hb;、b,、bi 和 bo 表示 十 进 制 数 0 到 9， 如 图 A-6 所 示 。 
这 4 个 变量 总 共有 16 个 不 同 的 值 ， 其 中 只 有 10 个 用 于 表示 十 进 制 数 ， 剩 下 的 值 没有 用 到 。 因 
此 ， 任 何 处 理 BCD 码 的 逻辑 电路 都 永远 不 会 在 其 输入 中 碰 到 这 6 个 值 中 的 任何 一 个 。 

图 A-6 给 出 了 一 个 操作 BCD 数 的 特定 函数 的 真 值 表 。 我 们 并 不 关心 那些 从 不 使 用 的 输入 
值 的 函数 值 是 多 少 ; 因此 ， 它 们 被 称 为 无 关 项 ( don’t-care )， 在 真 值 表 中 用 字母 “d” 表 示 。 在 
实现 电路 时 ， 对 应 于 无 关 项 的 防 数 值 可 被 任意 赋值 为 0 或 1。 最 佳 的 赋值 方法 是 使 其 能 够 用 最 
小 的 逻辑 门 实现 的 方法 。 当 无 关 项 能 够 扩大 一 个 1 值 的 组 时 ， 我 们 就 把 它 赋 值 为 1。 因 为 较 大 
的 组 对 应 着 较 小 的 乘积 项 ， 适 当地 使 用 无 关 项 能 够 更 大 限度 地 将 电路 最 小 化 。 
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图 A-6 中 的 函数 表示 了 如 下 对 输入 十 进 制 数 的 处 理 过 程 ， 当 输入 是 一 个 可 被 3 整除 的 非 


零 数 时 ， 输 出 了 为 1。 我 们 需要 3 个 组 来 包含 图 中 的 3 
个 值 为 1 的 方块 ， 并 且 尽 可 能 使 用 无 关 项 来 扩大 组 。 


A.4 与 非 门 、 或 非 门 的 组 合 
现在 来 看 另外 两 个 被 称 为 与 非 门 (NAND ) 和 或 非 

门 (NOR ) 的 基本 逻辑 门 ， 由 于 它们 的 电路 实现 很 
简单 ， 因 此 在 实践 中 被 广泛 使 用 。 这 些 门 的 真 值 表 如 
图 A-7 所 示 。 它 们 等 价 地 实现 了 “与 ”和 “或 ”函数 后 
接 一 个 “ 非 ” 函 数 ， 这 便 是 它们 的 名 称 以 及 标准 逻辑 符 
号 的 由 来 。 我 们 用 箭头 “1 ”和 “上 ”代表 与 非 及 或 非 
运算 符 ， 使 用 表 A-4 中 的 德 摩根 律 ， 可 以 得 到 

X11 X2 = XX2 = XI + Xa 
和 

X11 X2 = XI Xa = XX 
存在 多 于 两 个 输入 的 与 非 门 和 或 非 门 ， 根 据 德 摩根 律 的 
简单 扩展 可 以 得 到 


和 个 各 个 各 三 和 和 n= Xt Xa + + 





和 

Xi J X24 Xi + 二 .+x = XX; + * 

使 用 与 非 门 和 或 非 门 进 行 逻辑 设计 不 像 使 用 与 、 
或 、 非 门 那 样 直截了当 。 设 计 过 程 的 主要 难点 之 一 是 结 
合 律 对 与 非 和 或 非 操 作 是 无 效 的 。 我 们 稍 后 青 对 这 一 问 
题 展 开 讨 论 。 先 来 讨论 只 使 用 与 非 门 实现 任意 逻辑 函数 
的 简单 过 程 。 将 一 个 积 之 和 形式 的 逻辑 网 络 变换 成 只 由 
与 非 门 组 成 的 网 络 有 一 个 直接 的 方法 。 借 助 下 面 的 例子 
我 们 可 以 很 容易 地 了 解 这 个 过 程 。 考 虑 下 面 由 三 个 2 输 


十 进 制 数 表 示 | ”二进制 编码 
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f = bsbo+b,bibo+ bb1bo 


图 A-6 带 有 无 关 项 的 4 变量 卡 诺 图 


入 与 非 门 组 成 的 4 输入 网 络 的 逻辑 表达 式 的 代数 运算 过 程 。 





a ) 与 非 门 
A-7 与 非 门 和 或 非 门 





f= xz = M+X = XXy 
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b ) 或 非 门 
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(x1t x2) t (x3 t xa) = (KIX2)(X3x4 
= 列 南 + 列 对 


= XIX2 + X3X4 


在 推导 过 程 中 我 们 使 用 了 德 摩根 律 和 对 合 律 。 图 A-8 给 出 了 与 这 个 推导 对 应 的 逻辑 网 络 。 
因为 任何 逻辑 函数 都 可 以 表示 为 “ 积 之 和 ”( 与 -或 ) 形式 ， 而 且 前 述 的 导出 过 程 完全 可 逆 。 
我 们 得 出 结论 ， 任 何 逻 辑 函 数 都 可 以 表示 为 “与 非 -与 非 ” Ds 形式 。 可 以 看 到 
这 一 结论 对 含有 任意 数量 变量 的 函数 都 是 正确 的 。 与 非 门 的 输入 数 显 然 与 相应 的 与 门 和 或 门 的 


输入 数 相同 。 则 

我 们 回 到 关于 结合 律 对 与 非 操 作 x 
符 不 适用 这 一 话题 上 来 。 按 照 图 A-8 中 ， = 
的 步 又 使 用 与 非 门 对 逻辑 网 络 进行 设 





计时 ， 可 能 需要 具有 更 多 输入 数 的 与 非 人 
门 〈 比 实际 中 能 够 实现 的 与 非 门 输入 数 
还 要 多 )。 这 是 因为 与 和 或 操作 符 是 可 结 
合 的 ， 可 以 将 与 门 和 或 门 直接 级 联 起 来 。 
使 用 2 输入 门 实现 3 输入 与 函数 和 或 函 


数 的 情况 如 图 A-9a 所 示 。 使 用 与 非 门 的 ee 
解决 方案 就 不 这 么 简单 了 。 例 如 ， 一 个 3 A 等 伯 的 与 非 一 5 非 和 与 -或 网 兴 
输入 与 非 函 数 不 能 用 两 个 2 输入 与 非 门 级 联 实现 ， 而 需要 三 个 门 ， 如 图 A-9b 所 示 。 


4 > 
240- > 


a ) 用 2 输入 门 实 现 3 输入 与 范 数 和 或 函数 
二 


b ) 用 2 输入 门 实现 3 输入 与 非 顶 数 
图 A-9 门 的 级 联 


对 只 使 用 或 非 门 实现 逻辑 函数 的 讨论 与 前 面 类 似 。 任 意 逻 辑 函 数 都 可 以 表示 为 “和 之 积 ” 
(或 -与 ) 的 形式 。 这 样 的 网 络 可 以 由 等 价 的 或 非 - 或 非 网 络 实现 。 

前 面 的 讨论 介绍 了 一 些 逻 辑 设计 的 基本 概念 。 这 一 主题 的 详细 讨论 可 在 许多 教科 书 中 找 
到 (参见 参考 文献 [1 一 7] )。 


0 0 
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需要 明确 指出 的 是 ， 一 个 给 定 的 逻辑 函数 可 能 有 许多 不 同 的 实现 。 由 于 实际 应 用 的 需要 ， 
我 们 要 找到 成 本 最 低 的 实现 方法 ， 还 经 常 需要 考虑 减少 迎 辑 网 络 中 的 传输 延迟 。 为 了 描述 逻辑 
组 合 的 性 质 和 尽 可 能 地 降低 成 本 ， 前 几 节 中 介绍 了 最 小 化 的 概念 。 例 如 ， 卡 诺 图 图 形 化 地 表明 
了 得 到 最 佳 结 果 的 操作 。 尽 管理 解 逻辑 网 络 的 最 优化 法 则 很 重要 ,但 并 不 需要 人 工 实现 最 优 
化 。 复 杂 的 计算 机 辅助 设计 ( Computer-Aided Design，CAD ) 程序 可 以 完成 好 辑 集成 和 最 优 
化 。 设 计 者 只 需要 指定 所 需 的 功能 行为 ，CAD 软件 就 会 给 出 一 个 实现 这 一 功能 的 经 济 且 高 效 
的 网 络 . 

A.5 逻辑 门 的 实现 

现在 让 我 们 关注 在 实践 中 表示 逻辑 变量 和 实现 逻辑 函数 的 方法 。 表 示 罗 辑 变 量 的 物理 参 
数 的 选择 明显 依赖 于 具体 的 技术 。 在 电路 里 ， 电 和 平 或 电流 值 都 可 以 用 于 此 目的 。 

为 了 建立 电 平和 逻辑 值 或 状态 的 对 应 关系 ,我 们 引入 了 阅 值 ( threshold ) 这 一 概念 。 高 于 
给 定 阔 值 的 电 平 表 示 一 个 逻辑 值 ， 而 低 于 阔 值 的 电 平 表示 另 一 个 逻辑 值 。 在 实际 情况 下 ， 由 于 
各 种 各 样 的 原因 ， 电 路 中 任何 一 点 的 电 平 都 有 小 的 随机 变化 。 因 为 存在 “噪声 " ， 我 们 不 能 确 
定 浆 值 附近 电 平 的 逻辑 状态 。 如 图 A-10 所 示 ， 为 了 避免 出 现 这 样 的 不 确定 性 ， 应 该 确定 一 个 
“禁止 范围 "。 这 样 ， 低 于 [mox 的 电 平 表示 0 值 ， 高 于 Vwmin 的 电 平 表示 1 值 。 在 下 面 的 讨论 
中 ， 将 经 常用 到 “ 低 ” 和 “高 ”这 两 个 术语 来 分 别 表示 与 逻辑 值 0 和 1 对 应 的 电 平 。 

我 们 对 实现 基本 逻辑 函数 的 电子 线路 的 讨论 将 从 简单 的 由 电阻 和 晶体 管 开关 组 成 的 电路 
开始 。 考 虑 图 A-11 中 的 电路 。 当 图 A-11a 中 的 开关 5 闭合 时 ， 输 出 电 平 Ku 等 于 0 (接地 )。 
当 S 打 开 时 ,输出 电 平 Vu 等 于 提供 的 电 平 了 ,poy。 图 A-11b 用 晶体 管 了 代替 了 开关 33， 也 可 
以 得 到 同样 的 效果 。 当 提供 给 晶体 管 的 门 输入 电 平 为 0 时 ( 即 i, = 0)， 晶体 管 相当 于 一 个 打 
开 的 开关 ， 且 Vow = Vsppy。 当 了 变化 为 Vwppy 后 ， 唱 体 管 相当 于 一 个 闭合 的 开关 ， 输 出 电 平 
Vu 非常 接近 0。 因 此， 该 电路 实现 了 一 个 逻辑 非 门 的 功能 . 





电压 
t 
Vmax 下 TT Vsupply Vsupply 
逻辑 值 1 
R R 
Vi,min 轩 注 
Veit 门 Vout 
前 入 十 禁止 范围 \、 1 汽 极 
s vis 一 7 
VO, max 3 源 极 
逻辑 值 0 一 = 
ds a) b) 


图 A-10 用 电 平 表示 逻辑 值 图 A-11 一 个 反 相 器 电路 


现在 可 以 讨论 更 为 复杂 的 逻辑 函数 的 实现 。 图 A-12 显示 了 或 非 门 的 实现 电路 。 在 这 种 情 
况 下 ， 只 有 当 开 关 5。 和 5 都 打开 时 ， 图 A-12 中 的 Vw 才 是 高 电 平 。 与 之 类 似 ， 图 A-12b 中 只 
有 输入 电 平 及 和 态 都 是 低 电 平时 ，V 才 为 高 电 平 。 因 此 ， 该 电路 对 应 一 个 或 非 门 ， 其 中 斤 
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和 用 对 应 于 两 个 输入 变量 x1、x;。 容 易 验 证 ， 将 晶体 管 如 图 A-13 那样 串联 ， 就 可 以 得 到 一 个 
与 非 门 电路 。 逻 辑 函 数 “与 ”和 “或 ”可 以 分 别 使 用 与 非 门 和 或 非 门 ， 后 接 图 A-11 中 的 反 相 


器 实现 。 


Supply 


Vsupply 


R 
Vout 
Sa \ Sp 


a) 


Vout 





b) 
图 A-12 或 非 门 的 晶体 管 电路 实现 


Vsupply 


supply 


Vout Vout 


b) 
图 A-13 与 非 门 的 晶体 管 电路 实现 
注意 ,与 非 门 和 或 非 门 的 电路 实现 比 与 门 和 或 门 要 简单 。 因 此 ， 在 实践 中 经 常 大 量 使 用 
与 非 门 和 或 非 门 实现 逻辑 函数 。 本 书 中 所 举 的 许多 由 与 、 或 、 非 门 组 成 电路 的 例子 是 为 了 便于 
理解 。 在 实际 应 用 中 ， 逻 辑 电路 包含 所 有 这 5 种 门 电路 。 


A.5.1 CMOS 电路 
图 A-11 到 图 A-13 示例 了 使 用 NMOS 技术 (NMOS technology ) 实现 电路 的 一 般 结 构 。 


这 个 名 称 起 源 于 实现 逻辑 函数 的 晶体 管 是 NMOS 型 。 两 种 类 型 的 金属 氧化 物 半 导体 ( Metal- 
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Oxide Semiconductor，MOS ) 可 以 作为 开关 使 用 。 我 们 称 n 沟 道 晶 体 管 为 NMOS 类 型 ， 当 它 
的 门 输入 上 升 到 正 电 源 电 平 及 www 时 ， 表 现 为 一 个 闭合 的 开关 ， 如 图 A-14a 所 示 。 与 其 相反 的 
是 p 沟 道 晶体 管 ， 即 PMOS 类 型 。 当 门 电 平 Vo 等 于 Vwppy 时 ， 它 相当 于 一 个 打开 的 开关 ， 而 
当 门 电 平 Ve = 0 时 ， 它 相当 于 一 个 闭合 的 开关 ， 如 图 A-14b 所 示 。 注 意 PMOS 品 体 管 的 图 形 
表示 在 其 门 输入 处 有 一 个 圆圈 ， 表 示 它 的 行为 与 NMOS 晶体 管 相 反 。 还 要 注意 PMOS 晶体 
管 的 源 极 和 漏 极 名 称 也 与 NMOS 晶体 管 所 接 的 端 相 反 。NMOS 晶体 管 的 源 极 是 接地 的 ， 而 
PMOS 晶体 管 的 源 极 与 Vwppy 相连 。 这 些 命名 习惯 是 根据 晶体 管 中 的 电流 性 质 定 义 的 。 


Vp=0V 
VsS=0V 一 

当 Vc= JR 当 Vo= 0 时 

时 闭合 开关 打开 开关 


a ) NMOS 晶体 管 


V 


Vs=V. supply 


supply 
ve -| 


Vsupply 


| 


Vp Vp Vp= Vsupply 
当 Vo = Vsppiy 当 Ve=0 
时 打开 开关 时 闭合 开关 
b ) PMOS 晶体 管 


图 A-14 逻辑 电路 中 的 NMOS 和 PMOS 晶体 管 


A-11 到 图 A-13 电路 的 缺点 在 于 它们 的 能 量 损耗 。 当 开关 闭合 时 提供 了 地 与 上 拉 电 阻 尺 
之 间 的 通道 ， 电 流 从 Vwppiy 流向 地 。 相 反 ， 当 开关 打开 时 ， 没 有 到 地 的 通路 也 没有 电流 流 过 。 
(MOS 晶体 管 的 门 端 没有 电流 流 过 )。 因 此 ， 根 据 门 的 状态 ， 在 逻辑 电路 中 可 能 会 出 现 明 显 的 
能 量 损耗 。 

解决 能 量 损耗 问题 的 有 效 方法 是 同时 使 用 NMOS 和 PMOS 晶体 管 来 实现 电路 ， 使 之 在 稳 
定 状 态 下 不 消耗 能 量 。 这 种 方法 引出 了 CMOS ( 互补 金属 氧化 物 半 导体 ) 技术 。 图 A-15 的 反 
相 器 电路 示例 了 CMOS 电路 的 基本 思想 。 当 KV = Vwppy， 相 当 于 输入 x 的 逻辑 值 为 1， 晶体管 
九 关 闭 而 到 打开。 因此 丈 将 输出 电 平 矿 下 拉 到 0。 当 大 变 为 0 时 ， 唱 体 管 刀 打开 而 开关 
闭 。 这 样 ，7 将 输出 电 平 上 拉 至 人 wppy。 因 此 ,x 和 的 逻辑 值 互补 ， 电 路 实现 了 一 个 非 门 。 

这 个 电路 的 关键 特征 在 于 晶体 管 7 和 操作 是 完全 相反 的 : 当 一 个 是 打开 时 ， 另 一 个 就 
是 闭合 的 。 因 此 ， 从 输出 点 到 Vwppy 或 地 总 有 一 条 闭合 的 通路 。 但 是 ， 除 了 晶体 管 转换 状态 
时 非常 短 的 过 渡 期 外 ， 任 何 时 候 在 ,pp, 和 地 之 间 都 没有 闭合 通路 。 这 表明 当 电 路 处 于 稳定 状 
态 时 并 不 消耗 多 少 能 量 ， 仅 当 它 从 一 个 逻辑 状态 转变 到 另 一 个 逻辑 状态 时 消耗 能 量 。 因 此 ， 这 
个 电路 的 能 量 损耗 是 由 状态 转换 的 频率 决定 的 。 
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高 | 关 开 | 低 


a) 电路 b ) 真 值 表 与 晶体 管状 态 
图 A-15 非 门 的 CMOS 实现 


现在 我 们 可 以 将 CMOS 的 概念 扩 i 
展 到 nn 输 入 电路 ， 如 图 A-16 所 示 。 用 supply 


NMOS 品 体 管 实现 下 拉 网 络 ， 在 函数 下 









(x …, Xn) 等 于 0 时 建立 输出 点 /和 地 之 间 
的 闭合 通路 。 上 拉 网 络 由 PMOS 晶体 管 
构成 ， 在 畏 数 玉 (x1,…, 和 ) 等 于 1 时 建立 
输出 点 和 Vwppy 之 间 的 闭合 通路 。 上 拉 
和 下 拉 网 络 的 功能 是 相反 的 ， 因 此 在 稳定 
状态 ,输出 点 和 Kwppy 或 地 间 只 存在 一 CD 
条 闭合 通路 ， 而 不 会 两 者 同时 存在 。 
下 拉 网 络 的 实现 方式 与 图 A-11 至 
图 A-13 相同 。 图 A-17 给 出 了 与 非 门 的 实 一 一 
现 ， 图 A-18 给 出 了 或 非 门 的 实现 。 图 A-19 图 .16 MOS 对 光 粥 煌 
通过 将 与 非 门 的 输出 反 向 实现 了 与 门 。 





Vsupply 






0 0 
0 1 
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1 1 





a ) 电路 b ) 真 值 表 和 晶体 管状 态 
图 A-17 与 非 门 的 CMOS 实现 
除了 低能 量 损耗 ，CMOS 电路 的 优点 还 有 MOS 晶体 管 体 积 很 小 ， 因 此 在 集成 电路 芯片 上 
只 占用 很 小 的 地 方 。 这 个 特性 有 两 个 显著 的 优势 。 首 先 ， 它 使 得 在 芯片 上 集成 亿 万 个 晶体 管 成 
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为 可 能 ， 从 而 能 够 实现 现代 的 处 理 器 和 大 型 的 存储 芯片 。 其 次 ， 晶 体 管 的 体积 越 小 ， 它 从 一 个 
状态 到 另 一 个 状态 的 转换 就 越 快 。 因 此 ，CMOS 电路 运行 速度 可 达 GHz 级 。 


Vsupply 





a ) 电路 b ) 真 值 表 和 晶体 管状 态 
图 A-18 或 非 门 的 CMOS 实现 
不 同 CMOS 电路 的 运行 电 平 不 同 ， 最 y 六 
supply supply 


高 可 达到 15V。 最 常用 的 电 平 值 范围 是 

1 ~ 5V。 使 用 低 电 平 的 电路 消耗 的 能 量 更 少 

(能 量 消耗 约 与 让 swppy 成 正比 )， 这 意味 着 可 

以 在 一 块 芯片 上 放置 更 多 的 晶体 管 而 不 会 过 

热 。 低 电 平 的 缺点 是 减 小 了 噪声 屏蔽 。 V 
CMOS 反 相 器 中 高 低 电 平 信号 间 传 输 


的 细节 如 图 A-20 所 示 。 粗 的 曲线 为 传输 特 
性 曲线 (transfer characteristic )， 显 示 了 作为 
输入 电 平 函数 的 输出 电 平 的 变化 。 它 表明 当 v 


输入 电 平 经 过 Vwppy /2 附近 时 ， 输 出 电 平 会 
有 一 个 很 陡峭 的 变化 。 在 此 引入 一 个 立 值 电 
平凡 和 一 个 小 的 值 5， 如 果 i, < VV-5， 则 
as Vowpy， 如 果 所 ,> +6， 则 0。 这 国 A 1 4 的 CMOS 实现 
说 明 输 出 正确 的 信号 时 ， 输 入 信号 不 一 定 严格 等 于 限定 电 平 值 0 或 Vwpmy。 输 入 信号 中 可 能 会 
有 一 些 可 以 容忍 的 错误 ， 即 骂 声 (noise )， 它 们 不 会 引起 不 利 的 效果 。 可 以 容忍 的 噪声 量 称 为 
骂 声 容 限 ( noise margin )。 当 输入 的 逻辑 值 为 1 时 ， 这 一 容 限 是 Vppy 一 (V+ 5)， 而 当 输 入 逻 
辑 值 是 0 时 ， 这 一 容 限 是 -5。CMOS 电路 具有 出 色 的 噪声 容 限 。 

在 本 节 中 我 们 介绍 了 CMOS 电路 的 基本 特征 ， 读 者 如 想 了 解 此 技术 的 更 多 细节 ， 可 以 查 
阅 参 考 文献 [1] 和 [8]。 


A.5.2 传播 延迟 

逻辑 电路 不 能 够 立即 从 一 个 状态 转 到 另 一 个 状态 。 速 度 由 状态 变化 的 频率 来 衡量 。 一 个 
相关 的 参数 是 传播 延迟 ( propagation delay )， 由 图 A-21 定义 。 当 输入 的 状态 变化 后 ， 在 输出 
做 出 相应 变化 之 前 有 一 个 延迟 。 如 图 所 示 ， 通 常 传播 延迟 由 输入 和 输出 的 状态 转换 发 生 50% 
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时 刻 之 间 的 时 间 长 度 衡量 。 另 一 个 重要 的 参数 是 转换 时 间 ( transition time )， 通 常 由 信号 幅度 
10% 变化 至 90% 之 间 的 时 间 长 度 衡量 ， 如 图 所 示 。 逻 辑 电路 运行 的 最 大 速度 随 着 电路 通过 
不 同 路 径 传播 延迟 的 增加 而 减少 。 罗 辑 电 路 中 任 一 通路 的 延迟 是 此 通路 中 单个 门 延迟 的 总 和 。 
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Vsupply 
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Vgapply Vy 





图 A-20 CMOS 反 相 器 的 电 平 传输 特性 
转换 时 间 
Vi 一 -一 
输入 波形 


Vo 


Vi 
输出 波形 


Vo 





转换 时 间 
图 A-21 传播 延迟 和 转换 时 间 的 定义 


A.5.3 扇 入 扇 出 限制 
逻辑 门 的 输入 数 称 为 扇 入 ( fan-in )。 有 逻辑 门 输出 驱动 的 门 输入 数 称 为 扁 出 (fan-out )。 实 
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际 电 路 不 允许 过 大 的 扇 人 和 扇 出 ， 因 为 这 会 对 传播 延迟 和 电路 速度 产生 不 利 的 影响 。 

CMOS 门 中 的 每 个 晶体 管 都 有 一 定 的 电容 。 当 电容 增加 时 ， 电 路 速度 会 变 慢 ， 而 且 信 和 号 
电 平和 噪声 容 限 也 会 变 差 。 因 此 ， 需 要 对 扇 人 和 扇 出 进行 限制 ， 通 常 小 于 10。 如 果 需 要 的 输 
人 数 超过 了 最 大 的 扇 人 值 ， 必 须 再 使 用 一 个 同类 型 的 门 。 图 A-9a 显示 了 两 个 同类 型 的 门 如 何 
级 联 。 如 果 必 须要 某 个 门 驱动 的 输出 端 数 超过 扇 出 数 ， 可 以 使 用 两 个 同类 型 的 门 。 


A.5.4 ”三 态 缓冲 器 

在 目前 讨论 的 逻辑 门 中 ， 不 能 将 两 个 门 的 输出 连接 在 一 起 。 因 为 当 一 个 门 的 输出 值 是 1 
而 另 一 个 是 0 时 ， 我 们 不 能 确定 组 合 的 输出 信号 是 什么 值 ， 这 从 逻辑 角度 讲 是 没有 意义 的 。 更 
重要 的 是 ， 在 CMOS 电路 中 ， 输 出 为 1 的 门 建立 了 一 条 从 输出 端 到 KV,ypy 的 直接 通路 ， 而 输出 
为 0 的 门 建立 了 到 地 的 通路 。 因 此 ， 这 两 个 门 会 形成 对 电源 的 短路 ， 从 而 对 门 造成 损坏 。 

但 是 ， 在 计算 机 系统 设计 时 ， 许 多 时 候 会 出 现 电路 的 输入 信和 号 从 许多 不 同 的 源 中 获得 的 
情况 。 这 时 可 以 使 用 多 路 复 用 逻辑 电路 ， 这 个 内 容 将 在 A.10 节 中 讨论 。 也 可 以 使 用 称 为 三 态 
缓冲 器 (tri-state buffer ) 的 特殊 门 来 实现 。 三 态 缓冲 器 具有 三 个 状态 。 其 中 的 两 个 状态 产生 普 
通 的 0 和 1 信号。 第 三 个 状态 将 缓冲 器 的 输出 端 置 于 高 阻抗 状态 ,使 输出 在 电气 上 与 其 所 驱动 
的 输入 断 开 。 

图 A-22 描述 了 一 个 三 态 缓冲 器 。 这 个 缓冲 器 有 两 个 输入 和 一 个 输出 。 使 能 输入 e 控制 组 
冲 器 的 操作 。 当 e = 1 时, 输出 了 与 输入 x 具有 相同 的 逻辑 值 。 当 e = 0 时 ， 输 出 被 置 于 高 阻抗 
状态 Z。 与 其 等 效 的 电路 如 图 A-22b 所 示 。 图 中 的 三 角形 符号 代表 一 个 非 反 相 驱 动 器 。 这 个 电 
路 没有 实现 任何 逻辑 操作 ， 因 为 它 的 输出 仅仅 复制 了 输入 信和 号， 目的 是 提供 额外 的 电气 驱动 能 
力 。 在 与 图 中 的 输出 开关 组 合 后 ， 它 的 行为 根据 图 A-22c 的 真 值 表 动 作 。 这 个 表 描 述 了 所 需 的 
三 态 行为 。 图 A-22d 给 出 了 三 态 缓冲 器 的 电路 实现 。 将 一 个 NMOS 晶体 管 和 一 个 PMOS 晶体 
管 并 联 起 来 实现 一 个 开关 ， 与 驱动 的 输出 连接 。 因 为 这 两 种 晶体 管 的 门 输入 端 需要 相反 的 控制 
信号 ， 所 以 要 使 用 一 个 反 相 器 。 当 e = 0 时， 两 个 晶体 管 都 关闭 ， 相 当 于 一 个 打开 的 开关 ; 当 
e= 1 时 ， 两 个 晶体 管 都 打开 ， 相 当 于 一 个 闭合 的 开关 。 


a) 符号 b ) 等 效 电 路 





d) 实现 
图 A-22 三 态 缓冲 器 
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驱动 电路 可 能 需要 驱动 大 量 其 他 的 门 输 入 ， 这 些 门 的 总 容量 超过 了 普通 的 逻辑 门 电路 的 
驱动 能 力 。 为 了 提供 足够 的 驱动 能 力 ， 驱 动 电路 需要 更 大 的 晶体 管 。 因 此 ， 实 现 驱 动 器 的 两 个 
级 联 非 门 所 使 用 的 晶体 管 要 比 常规 逻辑 门 中 的 大 。 

读者 可 能 会 疑惑 为 什么 在 输出 开关 中 必须 使 用 PMOS 晶体 管 ， 因 为 从 逻辑 函数 的 角度 来 
看 ， 只 使 用 NMOS 晶体 管 也 可 以 取得 相同 的 效果 。 这 样 做 的 原因 是 这 些 品 体 管 必须 将 驱动 电 
路 产生 的 逻辑 值 “传递 ”到 输出 /而 结果 表明 NMOS 晶体 管 能 很 好 地 传送 0 值 ， 但 传送 1 值 
的 效果 很 差 ， 而 PMOS 晶体 管 正好 相反 。 因 此 NMOS 和 PMOS 的 并 联 能 够 很 好 地 传递 0 和 1 
值 。 关 于 这 一 问题 和 三 态 缓冲 器 的 更 详细 讨论 ， 读 者 可 以 参阅 参考 文献 [1]。 


A.6 触发 器 


大 部 分 数字 逻辑 的 应 用 都 需要 信息 的 存储 。 例 如 ， 控 制 密码 锁 的 电路 必须 记 住所 拨 数 字 的 
顺序 ， 以 确定 是 否 要 打开 锁 。 另 一 个 重要 的 例子 是 数字 计算 机 中 的 内 存 保存 程序 和 数据 。 

存储 二 进 制 信息 的 基本 电子 元 件 称 为 锁 存 器 ( latch )。 考 虑 图 A-23a 中 两 个 交叉 耦合 的 或 非 
门 组 成 的 电路 。 假 设 起 始 状 态 为 R= 1，S = 0。 简 单 的 分 析 表 明 Qs = 0，Qs = 1。 在 这 种 情况 下 ， 
门 G 的 两 个 输入 均 为 1。 这 样 ， 如 果 R 变 为 0，Q. 和 Qs 的 输出 不 会 有 任何 变化 。 如 果 S 设置 为 
1 而 R 等 于 0，Qs 和 Q; 将 分 别 是 1 和 0， 而 且 当 S 变 回 0 时 仍 会 保持 这 一 状态 。 因 此 ， 这 个 逻 
辑 电路 构成 了 一 个 存储 单元 或 锁 存 器 ， 它 记 下 了 两 个 输入 S 和 R 中 哪 一 个 最 近 等 于 1。 图 A-23b 
给 出 了 这 个 锁 存 器 的 真 值 表 。 图 A-23c 显示 了 锁 存 器 的 特征 波形 。 其 中 的 箭头 表明 了 信和 号 间 的 
因果 关系 。 注 意 当 输入 R 和 S 同时 从 1 变 到 0 时 ， 结 果 状 态 是 不 确定 的 。 实 际 上 ， 这 时 锁 存 
器 将 随机 假设 为 两 个 稳 态 中 的 一 个 。 输 入 值 R= S = 1 在 大 多 数 锁 存 器 中 不 使 用 。 





a) 网 络 b ) 真 值 表 





一 一 > 时 间 


c ) 时 序 图 
图 A-23 ”使 用 或 非 门 实现 的 基本 锁 存 器 
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根据 前 面 电 路 操作 的 性 质 , 将 S 线 和 RR 线 称 作 置 位 (set) 和 复位 (reset ) 输入 。 由 于 通 
常 不 使 用 R = S = 1， 故 将 Q。 和 Q 输出 分 别 标记 为 Q 和 Q。 但 是 ，Q 只 是 代表 锁 存 器 的 第 二 
个 输出 ， 而 并 不 是 Q 的 反 ， 因 为 输入 值 R= S = 1 的 结果 是 Q =Q= 0。 


A.6.1 ” 门 控 锁 存 器 

许多 应 用 需要 有 RR 和 S 以 外 的 输入 控制 锁 存 器 置 位 或 复位 的 时 间 ， 这 个 输入 称 为 时 钟 
(clock )。 组 合 的 结果 称 作 门 控 SR 锁 存 器 ( gated SR latch )。 该 锁 存 器 的 逻辑 电路 、 真 值 表 、 
时 序 图 和 图 形 符号 如 图 A-24 所 示 。 当 时 钟 Clk 等 于 1 时 ， 信 和 号 S' 和 R' 的 值 分 别 等 于 S$ 和 有。 
另 一 方面 ， 当 Clk = 0 时 ， 信 和 号 S' 和 R' 均 等 于 0， 并 且 锁 存 器 不 会 发 生 任 何 状 态 变 化 。 

至 此 我 们 一 直 使 用 真 值 表 描述 逻辑 电路 的 行为 。 真 值 表 给 出 了 一 个 电路 的 各 种 输入 值 及 
相对 应 的 输出 。 每 个 输入 值 唯 一 地 定义 输出 的 逻辑 电路 为 组 合 电路 (combinational circuit )。 这 
是 在 A.1 到 A.4 节 中 讨论 的 一 类 电路 。 当 出 现存 储 元 件 后 ， 我 们 得 到 了 一 种 不 同 种 类 的 电路 。 
这 种 电路 的 输出 函数 不 只 取决 于 输入 变量 的 当前 值 ， 还 反映 了 输入 变量 以 前 的 行为 。 图 A-24 
给 出 的 就 是 这 样 一 个 例子 。 这 种 类 型 的 电路 称 为 时 序 电 路 ( sequential circuit )。 





R R’ 
Q QW (不 变化 ) 
QW (不 变化 ) 
Clk 
Q 
S S 
a) 电路 b ) 真 值 表 
1 
Clk 
0 
1 
R 
0 
1 
S 
0 
1 
Q 
0 
sd 
a 
0 





d ) 图 形 符 号 
图 A-24 门 控 SR 锁 存 器 


491 
493 


494 
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由 于 存储 的 特性 ， 锁 存 器 的 真 值 表 需要 修改 ， 以 显示 当前 状态 所 产生 的 影响 。 图 A-24b 
描述 了 门 控 SR 触发 器 的 行为 ， 其 中 Q (7) 代表 它 的 当前 状态 。 到 下 一 个 状态 Q (t+ 1) 的 转换 发 
生 在 一 个 时 钟 脉 冲 之 后 。 注 意 当 输入 值 为 S=R= 1 时 ,由 于 前 面 讨论 的 原因 ，Q (t+ 1) 的 值 是 
不 确定 的 。 

如 图 A-25 所 示 ， 门 控 SR 锁 存 器 可 以 用 与 非 门 
实现 。 这 是 一 个 有 用 的 例子 ， 可 以 证 明 这 个 电路 在 
功能 上 等 效 于 图 A-24a 中 的 电路 ( 参见 习题 A.20 )。 

第 二 种 类 型 的 门 控 锁 存 器 称 为 门 控 D 锁 存 器 
( gated D latch )， 如 图 A-26 所 示 。 在 这 种 情况 下 ，S 6 
和 R 两 个 信号 是 从 单一 输入 D 导出 的 。 在 一 个 时 钟 ”R 
脉冲 中 ， 如 果 D = 1， 输 出 Q 被 置 位 为 1， 或 当 D = 
0 时 输出 被 复位 为 0。D 触发 器 在 时 钟 为 高 电 平时 采 图 A-25 使 用 与 非 门 实现 门 控 SR 锁 存 器 
样 输入 D 的 值 并 存储 该 值 ， 直 到 下 一 个 时 钟 脉 冲 到 来 。 


S 


Clk 


Qi) 
0 
1 





Clk 
D 
Q 
一 ww 时 间 
d ) 时 序 图 
图 A-26 门 控 DD 锁 存 器 
A.6.2 主 从 触发 器 


在 图 A-24 的 电路 中 ,我 们 假设 了 当 Clk = 1 时 , 输入 S 和 RR 不 发 生 改变 。 考 察 电路 会 发 
现 ， 在 这 个 时 间 内 ,不管 输入 S 和 R 发 生 什么 变化 ， 输 出 都 会 立即 做 出 响应 。 类 似 地 ， 在 
图 A-26 的 电路 中 ， 当 Clk = 1 时 ，Q = D。 在 许多 情况 下 ， 这 种 情况 不 是 我 们 想 要 的 ， 尤 其 是 
对 于 包含 计数 器 和 移 位 寄存 器 的 电路 ， 关 于 计数 器 和 移 位 寄存 器 我 们 之 后 会 讨论 。 在 这 样 的 电 
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路 中 ,将 逻辑 条 件 立 即 从 数据 输入 端 (R、S 和 D ) 传递 到 锁 存 器 的 输出 往往 会 导致 错误 的 操 
作 。 主 从 (master-slave ) 结构 解决 了 这 个 问题 。 如 图 A-27a 所 示 ， 两 个 门 控 D 锁 存 器 可 以 连 
接 成 一 个 主 从 D 触发 器 ( master-slave D flip-flop )。 首 先 ， 当 Clock = 1 时 主 触发 需 与 输入 D 相 
连 。 时 钟 从 1 到 0 的 跳 变 使 主 触 发 器 与 输入 断 开 ， 并 将 主 触发 器 中 存储 的 内 容 传送 到 从 触发 
器 。 我 们 可 以 看 到 ， 在 输入 D 和 输出 Q 之 间 任 何 时 候 都 不 存在 直接 的 通路 。 

需要 注意 的 是 ， 当 Clock = 1 时 ， 主 触发 器 的 状态 直接 受到 输入 D 变化 的 影响 。 从 触发 
器 的 功能 是 在 将 主 触发 器 设置 为 由 输入 D 决定 的 下 一 个 状态 值 的 期 间 ， 保 持 触发 器 的 输出 值 。 
时 钟 从 1 跳 变 到 0 后 ， 新 状态 就 从 主 触发 器 传送 到 从 触发 器 。 这 时 ， 主 触发 器 已 经 与 输入 断 
开 ， 因 此 输入 D 的 任何 变化 都 不 会 影响 传送 过 程 。 状 态 转换 的 例子 如 图 A-27b 的 时 序 图 所 示 。 

触发 器 ( flip-flop ) 是 指 一 种 在 控制 时 钟 信号 的 边缘 改变 状态 的 存储 元 件 。 在 前 面 讨论 的 
主 从 D 触发 器 中 ， 在 时 钟 的 下 降 沿 (1 到 0) 发 生 明 显 的 变化 。 当 变化 达到 从 触发 器 的 Q 端 
时 ， 就 可 以 观察 到 该 变化 。 注 意 在 图 A-27 的 电路 中 ， 也 可 以 使 用 反 向 的 时 钟 控制 主 触发 器 ， 
而 用 原 时 钟 控制 从 触发 器 。 这 时 ， 触 发 器 输出 Q 的 变化 就 会 在 时 钟 的 上 升 沿 发 生 。 

图 A-27c 给 出 了 触发 器 的 图 形 符号 。 我 们 使 用 一 个 箭头 来 代替 标签 Clk 定义 此 触发 器 的 时 
钟 输入 。 这 是 定义 触发 器 上 升 沿 触发 状态 变化 的 标准 表示 方法 。 在 我 们 的 图 中 是 下 降 沿 触发 状 
态 变化 的 ， 因 此 在 时 钟 输入 端 ( 箭头 之 外 ) 再 画 一 个 小 圆圈 。 























a) 电路 
Clock 
D 
Qn 
Q=Q, 

b ) 时 序 图 

中 
c ) 图 形 符号 


图 A-27 主 从 D 触发 器 
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A.6.3 边沿 触发 

如 果 输 入 端的 数据 只 在 时 钟 信号 跳 变 时 传送 给 输出 端 ， 我 们 就 说 触发 器 是 边沿 触发 
( edge triggered ) 的 。 在 其 他 所 有 时 间 输 入 与 输出 都 是 断 开 的 。 上 升 沿 ( 前 洛 ) 触发 (positive 
(leading) edge triggered ) 和 下 降 沿 (后 沿 ) 触发 (negative ( trailing ) edge triggered ) 分 别 描述 
了 数据 传送 发 生 在 0 到 1 和 1 到 0 时钟 跳 变 的 触发 器 。 为 了 进行 正确 的 操作 , 边沿 触发 的 触发 
器 要 求 时 钟 脉 冲 的 触发 沿 定义 明确 并 且 跳 变 时 间 很 得。 图 A-27 中 的 主 从 触发 器 是 一 个 下 降 沿 
触发 器 。 

下 降 沿 触发 D 触发 器 的 另 一 种 实现 如 图 A-28a。 让 我 们 看 一 下 这 个 触发 器 的 操作 过 程 。 如 
果 Clk = 1, 门 2 和 3 的 输出 均等 于 0。 因 此 ， 触 发 器 输出 Q 和 Q 维持 触发 器 的 当前 状态 。 容 
易 验证 在 这 段 时 间 内 ，P3 点 和 P4 点 会 立即 响应 DD 的 变化 。P3 点 保持 与 D 相等 ， 而 P4 点 保 
持 与 D 相等 。 当 Clk 下 降 为 0 时 ， 这 些 值 通过 门 2 和 3 分 别传 送 到 P1 和 P2。 因 而 ， 由 门 5 和 
6 组 成 的 输出 锁 存 器 得 到 了 需要 存储 的 新 状态 。 

我 们 现在 验证 一 下 当 Clk = 0 时 , DD 的 变化 不 会 改变 Pl 点 和 了 2 点 。 考 虑 两 种 情况 。 首 先 ， 
假设 在 Clk 的 下 降 沿 D = 0。P2 处 的 1 使 得 门 2 和 4 都 分 别 有 一 个 输入 保持 为 1， 这 使 得 Pl 和 
P2 为 0 和 1, 与 D 的 任何 变化 无 关 。 接 着 ,假设 在 Clk 下降 沿 D = 1。P1 处 的 1 使 得 D 的 任 
何 变 化 都 不 会 影响 到 门 1， 门 1 保持 为 0。 

当下 一 个 时 钟 脉冲 开始 时 Clk 上 升 为 1，P1 点 和 P2 点 再 一 次 被 强制 置 为 0， 使 输出 与 电 
路 的 其 他 部 分 断 开 。P3 点 和 P4 点 跟随 D 的 变化 而 变化 ， 如 我 们 前 面 所 描述 的 一 样 。 

这 种 D 触发 器 的 操作 示例 如 网 A-28b 所 示 。 触 发 器 在 Clk 从 1 跳 变 到 0 时 的 状态 等 于 在 
这 一 跳 变 之 前 输入 D 的 值 。 但 是 , 在 C 大 下 降 沿 附近 存在 一 个 临界 时 间 段 Tcx， 期 间 D 上 的 值 
不 应 改变 。 如 图 所 示 ， 这 段 时 间 分 为 两 部 分 : 时 钟 边沿 前 的 建立 时 间 (setup time ) 和 时 钟 边沿 
后 的 保持 时 间 (hold time )。 时 序 图 显示 输出 Q 在 时 钟 下 降 治 过 后 稍 晚 一 些 才 有 变化 。 这 是 由 
于 受到 了 与 非 门 传输 延迟 的 影响 。 





a ) 网 络 
图 A-28 下 降 沿 触发 的 D 触发 器 
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1 
Clk 
0 
六 1 
0 
1 
Q 0 
b ) 时 序 举例 
图 A-28 ( 续 ) 
A.6.4 本 触发 器 


使 用 最 为 广泛 的 触发 器 是 D 触发 器 ， 因 为 它们 对 数据 的 临时 存储 很 有 用 。 但 是 ,在 一 些 
应 用 中 ， 使 用 其 他 类 型 的 触发 器 会 很 方便 。 我 们 将 在 A.8 节 中 讨论 的 计数 器 电路 就 是 由 工 触 发 
器 构成 的 。 当 其 输入 T 等 于 1 时 ,TT 触发 器 (Tflip-flop ) 在 每 个 时 钟 周 期 都 改变 状态 。 我 们 称 
它 “ 翻 转 ”( toggle ) 自己 的 状态 。 

图 A-29 显示 了 T 触 发 器 。 如 图 A-29a 所 示 ， 它 的 电路 从 D 触发 器 派生 得 来 。 图 中 还 给 出 
了 它 的 真 值 表 、 图 形 符号 以 及 时 序 图 举例 。 注 意 现在 假设 的 是 一 个 上 升 沿 触发 的 触发 器 。 





b ) 真 值 表 c) 图 形 符号 


Clock 
T 


Q 
d ) 时 序 图 
图 A-29 TT 触发 器 
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A.6.5 JK 触发 器 

在 实际 中 会 遇 到 的 另 一 种 触发 器 是 下 触发 器 ( JkK flip-fop )， 它 组 合 了 SR 触发 器 和 T 触 
发 器 的 功能 ， 如 图 A-30 所 示 。 它 的 操作 由 图 A-30b 中 给 出 的 真 值 表 定 义 。 表 中 的 前 三 行 定义 
了 与 图 A-24b ( 当 Clk = 1 时 ) 中 一 样 的 表现 ， 所 以 J 和 上 分别 对 应 S 和 R。 当 输入 值 ]=K = 
1 时 ， 下 一 个 状态 定义 为 与 当前 触发 器 相反 的 状态 。 即 当 J=K= 1， 下 触发 器 的 功能 就 相当 于 
一 个 T 触发 器 ， 翻 转 当 前 的 状态 。 

下 触发 器 可 以 使 用 D 触发 器 联结 成 


Clock 


K 
0 
1 
0 
1 


0 
0 
1 
1 





图 A-30 下 触发 器 


JK 触发 器 可 以 有 多 种 用 途 。 它 可 以 像 D 触发 器 一 样 用 来 存储 数据 。 它 也 可 以 用 来 构造 计 
数 器 ， 因 为 当 J 和 输入 连 在 一 起 时 ， 就 表现 为 一 个 T 触 发 器 。 


A.6.6 ” 带 预 置 和 清除 的 触发 器 

触发 需 的 状态 由 它 的 当前 状态 和 输入 端的 逻辑 值 决定 。 有 时 需要 强制 将 触发 器 置 于 某 个 
特定 状态 0 或 1， 而 不 管 它 的 当前 状态 和 正常 输入 值 是 什么 。 例 如 ， 当 打开 计算 机 时 ， 需 要 将 
所 有 的 触发 器 都 置 于 一 个 已 知 状态 。 通 常 是 将 它们 的 输出 复位 为 0 状态 。 有 些 时 候 也 需要 将 一 
些 触 发 器 置 为 1 状态 。 

图 A-31 显示 了 如 何 将 预 置 和 清除 控制 输入 加 到 主 从 D 触发 器 上 ,不 管 D 输入 和 时 钟 是 
什么 ， 都 将 触发 器 强制 置 为 1 或 0。 图 中 的 上 划 线 和 圆圈 显示 这 些 输入 是 低 电 平 有 效 的 。 当 预 
置 ( Preset ) 和 清除 ( Clear ) 输入 都 等 于 1 时 ， 和 触发 器 就 在 正常 情况 下 由 时 钟 和 D 输入 控制 。 
当 Preset 等 于 0 时 ， 触 发 器 强 置 于 1 状态 。 而 当 Clear = 0 时， 触发 器 强 置 于 0 状态 。 在 其 他 
类 型 的 触发 如 中 也 常常 加 入 预 置 和 清除 控制 。 
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Clock 
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a) 电路 





Preset 


Clear 
b ) 图 形 符号 
图 A-31 带 预 置 和 清除 的 主 从 D 触发 器 


A.7 寄存 器 与 移 位 寄存 器 

每 个 触发 器 可 以 用 来 存储 一 位 数据 。 但 是 ， 在 以 字 为 单位 处 理 数 据 的 机 器 中 ， 字 由 许多 
位 组 成 (可 能 是 64 位 )。 为 了 处 理 数 据 的 方便 ， 我 们 将 许多 触发 器 组 合 为 一 种 常用 的 结构 ， 称 
为 寄存 器 ( register )。 寄 存 器 中 所 有 触发 器 的 操作 都 由 共同 的 时 钟 控制 。 因 此 ， 数 据 被 写 人 
( 载 人 ) 触发 器 或 从 触发 器 中 读 出 都 同时 进行 。 

处 理 数 字数 据 经 常 要求 有 移 位 和 循环 移 位 数据 的 能 力 ， 因 此 需要 提供 有 此 能 力 的 硬件 。 
能 实现 这 两 种 操作 的 简单 器 件 是 寄存 器 ， 其 内 容 可 以 每 次 向 左 或 向 右 移动 一 位 。 例 如 图 A-32 
中 的 4 位 移 位 寄存 器 。 它 是 由 D 触发 器 连接 成 的 ， 故 每 个 时 钟 脉冲 会 引起 从 Fi 到 Fi 的 内 容 
( 状态 ) 传递 ， 表 现 为 “ 右 移 "。 数 据 被 顺序 送信 或 送出 寄存 器 ， 将 输出 接 至 输入 可 以 实现 数据 
的 循环 移 位 。 





图 A-32 简单 的 移 位 寄存 器 | 
移 位 寄存 器 的 正确 操作 要 求 其 内 容 在 每 个 时 钟 脉冲 恰好 移动 一 位 。 这 就 限制 了 可 以 使 用 
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的 存储 元 件 类 型 。 图 A-26 描述 的 门 控 锁 存 器 不 适合 实现 此 操作 。 因 为 当时 钟 为 高 电 平时 ，D 
输入 的 值 很 快 就 传送 到 和 输出。 接着， 数据 又 以 相同 的 方式 经 过 下 一 个 门 控 锁 存 器 。 因 此 ， 在 一 
个 时 钟 脉冲 内 不 能 控制 移 位 发 生 的 次 数 。 这 个 次 数 由 门 控 锁 存 器 的 传输 延迟 和 时 钟 脉冲 的 持续 
时 间 决 定 。 解 决 这 个 问题 的 办 法 是 使 用 主 从 或 边沿 触发 器 。 

能 够 并 行 载 人 和 读 取 的 移 位 寄存 器 是 很 实用 的 。 这 可 以 通过 使 用 一 些 附加 的 门 来 实现 。 
如 图 A-33， 它 显示 了 用 D 触发 器 构成 的 4 位 寄存 器 。 这 个 寄存 器 既 可 以 串 行 也 可 以 并 行 地 载 
入 。 当 计时 开始 时 ， 如 果 Shift /Load = 0 就 发 生 移 位 ; 否则 ， 进 行 并 行 载 人 。 

并 行 输出 








Clock 


串 行 输入 二 
Shift/Load 并 行 输入 


图 A-33 并行 访问 的 移 位 寄存 器 


A.8 计数 器 


在 前 面 的 一 节 中 ， 我 们 讨论 了 触发 器 在 构造 移 位 寄存 器 时 的 应 用 。 它 们 在 实现 计数 器 
(counter ) 电路 时 也 同样 有 用 。 计 数 器 在 数字 机 器 中 的 重要 性 无 需 多 言 。 除 了 具有 一 般 的 计数 
功能 外 ， 计 数 器 还 可 以 用 来 产生 控制 和 时 序 信号 。 由 高 频 时 钟 驱动 的 计数 器 可 以 产生 频率 为 原 
始 时 钟 分 频 的 信号 。 在 这 样 的 应 用 中 计数 器 作为 定 标 器 〈scaler ) 使 用 。 

图 A-34 显示 了 由 了 触发 器 构成 的 一 个 简单 的 3 段 (或 3 位 ) 计数 器 。 回 忆 一 下 当 工 输入 
等 于 1 时， 触发 器 表现 为 一 个 双 态 触发 器 ， 即 每 个 连续 的 时 钟 脉冲 都 会 引起 状态 的 变化 。 
此 ， 两 个 时 钟 脉冲 将 会 使 Q。 从 1 状态 变 为 0 状态 再 回 到 1 状态 ， 或 从 0 到 1 再 到 0。 这 说 明 
Qo 输出 波形 的 频率 是 时 钟 频率 的 一 半 。 类 似 地 ， 因 为 第 二 个 触发 器 是 由 Qo 驱动 的 ， 所 以 Qi 
的 波形 是 Qo 频率 的 一 半 ， 即 时 钟 频率 的 114。 注 意 我 们 假设 每 个 触发 器 的 状态 都 在 时 钟 输 入 的 
上 升 沿 发 生 改 变 。 

这 样 的 计数 器 常 被 称 作 行 波 计数 器 (ripple counter )， 因 为 输入 时 钟 脉冲 的 影响 像 行 波 一 
样 通过 计数 器 。 例 如 ， 脉 冲 4 的 上 升 沿 将 Q 的 状态 从 1 变 到 0。Q 的 这 个 变化 会 迫使 Q 从 
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1 变 到 0， 而 后 按 顺 序 迫使 Q; 从 0 到 1。 如 果 每 个 触发 器 产生 的 延迟 为 A， 则 Q: 的 延迟 就 是 
3 A。 当 要 求 计 数 器 高 速 运行 时 ， 这 样 的 延迟 就 会 成 为 一 个 问题 。 但 在 许多 应 用 中 ， 这 些 延 迟 
与 时 钟 周期 相 比 非常 小 ， 因 而 可 以 被 忽略 。 

增加 一 些 额外 的 逻辑 门 ， 就 可 以 构建 一 个 “同步 ”计数 器 ， 其 每 个 阶段 都 在 公用 时 钟 控 
制 之 下 ， 因 此 所 有 触发 器 可 以 同时 改变 状态 。 因 为 总 的 延迟 显著 减少 ， 所 以 这 样 的 计数 器 可 以 
高 速 运行 。 与 之 相对 ， 图 A-34 中 的 计数 器 称 为 “异步 ”计数 器 。 


Clock 





a) 电路 
Clock 
Qo 
QI 
Q: 

计数 0 1 2 3 4 5 6 3 0 
b ) 时 序 图 
图 A-34 3 位 升值 计数 器 

A.9 译 码 器 


计算 机 中 的 许多 信息 都 是 高 度 编码 的 。 在 指令 中 ,一 个 n 位 字段 可 以 用 来 表示 从 2" 种 可 
能 的 动作 中 选 出 一 个 去 执行 。 为 了 执行 所 需 的 操作 ， 编 码 的 指令 必须 先 被 译 码 。 能 够 接受 变 
量 输入 并 在 2" 个 输出 线路 中 产生 一 个 相应 输出 信号 的 电路 称 作 译 码 器 (decoder )。 图 A-35 给 
出 了 一 个 2 输入 4 输出 的 简单 译 码 器 的 


Xl 


例子 。 如 图 所 示 ， 由 输入 x 和 x 从 4 条 . 
输出 线路 中 选 出 一 个 。 被 选 出 的 输出 具 
有 逻辑 值 1， 剩 下 的 输出 值 都 是 0。 2 


译 码 器 还 存在 其 他 形式 。 例 如 ,使 
用 BCD 码 的 信息 经 常 需要 一 个 具有 4 
变量 BCD 输入 的 译 码 电路 ， 它 能 从 10 ! 
个 可 能 的 输出 中 选择 1 个 有 效 输出 。 考 
虑 另 一 个 具体 的 例子 ， 一 个 能 够 驱动 七 0 
段 显示 器 的 译 码 器 。 图 A-36 给 出 了 用 
于 显示 的 七 段 元 件 的 结构 。 容 易 看 出 ， 图 A-35 2 输入 4 输出 译 码 器 
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从 0 到 9 的 任意 十 进 制 数 都 可 以 通过 打开 一 些 段 ( 亮 ) 而 关闭 男 一 些 段 (上 暗 ) 的 方式 显示 出 来 。 
表 中 给 出 了 一 些 必 要 的 函数 。 它 们 可 以 使 用 图 中 的 译 码 器 电路 实现 。 注 意 这 个 电路 是 由 与 非 门 
组 成 的 。 希 望 读 者 自己 验证 该 电路 实现 了 所 需 的 功能 。 


























1 i 区 a C e 号 
Toloooolrii11 0 

， 1|0o0oo1l1|lo1l1looo0oo0 
mp 2|10010|11011 1 
| E 3|0011|11111001 
a 4|10100|0110011 
.| |: 5|0101|11011011 
| 6|0110|110o011111 
了 7|0111|1110000 
g8|1000|1111111 

[| | 于 并 











图 A-36 BCD 码 七 段 显示 器 译 码 器 


A.10 多 路 复 用 器 

在 前 面 一 节 中 ， 我们 看 到 译 码 器 根据 输入 信号 选择 一 条 输出 线 。 被 选中 的 输出 线 逻 辑 值 
为 1， 而 其 他 输出 均 为 0。 另 一 种 非常 有 用 的 选择 电路 能 够 从 个 数据 输入 中 选择 一 个 作为 
输出 。 选 择 操作 是 由 一 组 “选择 ”输入 控制 的 。 这 样 的 电路 称 作 多 路 复 用 器 ( multiplexer )。 
图 A-37 给 出 了 一 个 多 路 复 用 器 电路 的 例子 。 它 有 两 个 选择 输入 端 ，w! 和 w， 。 它 们 的 4 个 可 
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能 值 用 来 从 4 个 输入 Xx、x、 太 或 x 中 选择 一 个 作为 输出 z。 图 中 也 给 出 了 能 够 实现 所 需 操 作 
的 简单 逻辑 电路 。 显 然 ， 更 大 的 多 路 复 用 器 也 可 以 用 相同 的 结构 实现 ， 用 个 选择 输入 端 将 2* 
个 数据 输入 端 中 的 一 个 连接 到 输出 。 

多 路 复 用 器 的 一 个 常见 应 用 是 筛选 可 能 来 自 许多 不 同 源 的 数据 。 例 如 ， 从 4 个 数据 源 加 
载 一 个 16 位 数据 寄存 器 可 以 用 16 个 4 输入 多 路 复 用 器 实现 。 


[CT 





数据 输入 


1 
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X3 一 
AX4 一 | 
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选择 输入 


X2 
<3 


x4 


wl 2 
图 A-37 4 输入 多 路 复 用 器 


多 路 复 用 器 也 可 作为 实用 的 基本 元 件 用 来 实 
现 逻 辑 函 数 。 考 虑 由 图 A-38 中 的 真 值 表 定义 的 
函数 f。 它 可 以 如 图 中 那样 提取 出 变量 x, 和 x 来 
表示 。 可 以 发 现 对 xl 和 六 的 每 个 值 ， 函 数 太 对 
应 于 4 项 中 的 一 个 : 0、1、x% 或 五 。 这 意味 着 可 
以 使 用 一 个 4 输入 多 路 复 用 器 电路 ， 其 中 x1、x; 
是 选择 4 个 数据 输入 之 一 的 选择 输入 端 。 此 时 ， 
如 果 将 0、1、x3 和 元 按照 真 值 表 的 要 求 连接 到 
数据 输入 ， 则 多 路 复 用 器 的 输出 就 是 函数 大 这 
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种 方法 完全 是 通用 的 。 任 何 3 变量 函数 都 可 以 由 0 
一 个 4 输入 多 路 复 用 器 实现 。 类 似 地 ， 任 何 4 变 5 本 
量 的 函数 都 可 以 由 一 个 8 输入 多 路 复 用 器 实现 ， 

依次 类 推 。 

A.11 可 编程 逻辑 器 件 人 


在 前 面 几 节 中 我 们 介绍 了 如 何 使 用 门 和 触发 图 A-38 用 多 路 复 用 器 实现 逻辑 函数 











508 








332 : 附录 A 逻辑 电路 


器 来 实现 逻辑 电路 。 在 这 一 节 中 ， 我 们 将 要 考虑 只 需要 对 其 编程 就 可 以 实现 能 执行 所 需 功能 的 
电路 的 器 件 。 它 们 称 作 可 编程 逻辑 器 件 ( Programmable Logic Device，PLD )。 


A.11.1 可 编程 逻辑 阵列 

在 A.2 节 和 A.3 节 中 解释 过 ， 任 何 组 合 逻 辑 函 数 都 可 以 用 积 之 和 的 形式 实现 。 能 实现 多 
种 组 合 顶 数 的 通用 电路 可 以 组 织 为 图 A-39 所 示 的 形式 。 它 有 nn 个 输入 变量 (Xx.…, Xx) 和 m 个 
输出 函数 (fi,…,f )。 每 个 函数 /都 由 包含 输入 变量 的 乘积 项 之 和 组 成 。 变 量 x,…, x 以 真 值 
或 反 值 的 形式 被 送 入 与 阵列 ， 形 成 个 乘积 项 。 然 后 这 些 乘积 项 又 被 送 入 或 阵列 ， 形 成 输出 函 
数 。 为 使 该 电路 可 被 用 户 定制 ， 可 以 使 用 与 阵列 和 或 阵列 的 可 编程 连接 。 
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图 A-39 PLD 的 框图 


如 果 电 路 同 与 阵列 、 或 阵列 的 连接 是 可 编程 的 ， 则 该 电路 称 为 可 编程 逻辑 阵列 
( Programmable Logic Array，PLA )。 图 A-40 用 简单 的 例子 说 明了 PLA 的 功能 结构 。 当 可 编程 
连接 没有 同 与 门 给 出 的 输入 相连 时 ， 该 输入 的 表现 就 好 像 是 逻辑 1 在 驱动 它 一 样 ， 也 就 是 说 ， 
该 输入 对 这 个 门 实现 的 乘积 项 不 起 作用 。 类 似 地 ， 如 果 没 有 同 或 门 给 出 的 输入 相连 时 ， 该 输入 
对 这 个 门 的 输出 没有 任何 影响 ， 就 好 像 是 逻辑 0 在 驱动 它 一 样 。 

可 编程 连接 可 以 用 不 同 的 方法 实现 。 一 种 方法 是 ,熔断 不 需 连 接 位 置 的 金属 丝 。 这 需要 
使 用 高 于 常 值 的 电流 。 男 一 种 可 行 方法 是 使 用 可 擦 除 存 储 元 件 (参见 8.3.3 节 的 EPROM 存储 
电路 ) 控制 的 晶体 管 开 关 来 提供 所 需 的 连接 。 这 样 的 PLA 可 以 重新 编程 。 

图 A-40 中 简单 的 PLA 可 以 从 3 个 输入 变量 生成 4 个 乘积 项 。 使 用 这 些 乘积 项 可 以 实现 两 
个 输出 顶 数 。 有 些 乘积 项 可 以 被 不 止 一 个 输出 晒 数 使 用 。PLA 实现 了 下 面 两 个 函数 : 

f= XX + XiX3 + KIX2X3 
2= XIX2 十 XIX3 十 无 X2X3 
在 这 两 个 函数 中 有 两 个 相同 项 ， 因 此 只 需要 4 个 乘积 项 。 

尽管 图 A-40 清楚 地 描述 了 PLA 的 基本 功能 ,但 这 种 表示 形式 对 于 更 大 的 PLA 就 显得 有 
些 策 拙 了 。 在 科技 文献 中 的 一 个 惯例 是 使 用 只 有 一 条 输入 线 的 相应 门 符 号 来 表示 乘积 项 和 
求 和 项 。 对 于 每 个 已 编程 连接 在 该 线 上 打 一 个 义 号 “ x"。 图 A-41 使 用 这 种 图 示 方法 表示 
了 图 A-40 中 PLA 的 例子 。 为 了 实现 输入 变量 的 不 同 函 数 ， 图 中 任何 垂直 线 和 水 平 线 的 交点 都 
可 以 是 一 个 可 编程 的 连接 。 
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f1= XIX2 + XX + XI XX 


f2= XIX2 + XI XIX3 + XIX3 


图 A-40” PLA 的 功能 结构 











图 A-41 图 A-40 中 PLA 的 简化 图 


A.11.2 ”可 编程 阵列 逻辑 
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在 PLA 中 ， 与 阵列 、 或 阵列 的 输入 都 是 可 编程 的 。 有 一 种 相似 电路 ， 其 与 阵列 的 输入 是 
可 编程 的 但 同 或 门 的 连接 是 固定 的 ， 在 实际 应 用 中 它 提供 的 灵活 性 就 足够 了 。 这 样 的 电路 称 作 
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可 编程 阵列 逻辑 ( Programmable Array Logic，PAL ) 电路 。 

图 A-42 给 出 了 实现 两 个 函数 的 PAL 的 简单 例子 。 每 个 或 门 所 连接 的 与 门 数 量 决定 了 给 定 
函数 积 之 和 表达 式 中 乘积 项 的 最 大 数目 。 与 门 与 特定 的 或 门 永久 地 保持 连接 ， 这 意味 着 在 输出 
函数 中 不 能 共享 乘积 项 。 





万 = xxX2X3 十 XIX2X3 
三; XL XN 
图 A-42 ”PAL 举例 
或 门 的 输出 若 连 接触 发 器 ， 会 使 PAL 电路 具有 更 多 功能 。 图 A-43 显示 了 这 种 电路 的 灵活 


性 。 多 路 复 用 器 用 来 选择 在 或 门 输出 端 表示 的 了 是 真 值 、 反 值 还 是 存储 值 ( 从 前 一 个 时 钟 周期 
得 出 )。 多 路 复 用 器 的 选择 输入 以 可 编程 连接 的 形式 提供 。 


输出 





图 A-43 ”包含 触发 器 的 PAL 元 件 


A.11.3 复杂 可 编程 逻辑 器 件 ( CPLD ) 

PAL 结构 用 于 称 为 复杂 可 编程 远 辑 器 件 ( Complex Programmable Logic Device，CPLD ) 
的 较 大 需 件 中 。 这 些 器 件 包 括 许多 类 PAL 块 和 可 编程 互 连 线 。 图 A-44 给 出 了 CPLD 芯片 的 组 
织 。 每 个 类 PAL 块 都 与 许多 输入 /输出 管 脚 相连 。 类 PAL 块 之 间 的 连接 通过 对 与 互 连 线 相关 
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联 的 开关 编程 来 建立 。 





图 A-44 复杂 可 编程 逻辑 顺 件 (CPLD ) 组 织 


互 连 线 由 水 平 线 和 垂直 线 构成 。 每 条 水 平 线 都 可 通过 对 相应 开关 的 编程 与 几 条 生 直 线 连 
接 。 记 图 将 每 条 水 平 线 与 任意 的 垂直 线 连 接 组 成 完全 链接 是 不 切实 际 的 ， 因 为 所 需 的 开关 数 会 
很 大 。 少 量 的 开关 即 可 实现 满足 需求 的 连通 度 。 

市 场 上 的 CPLD 尺寸 不 同 ， 从 包含 2 个 到 100 个 以 上 类 PAL 块 的 都 有 。 通 过 向 JTAG 端 
口 (JTAG port ) 加 载 串 行 位 流 的 编程 信息 可 以 对 CPLD 芯片 编程 。JTAG 端口 是 一 个 4 管 脚 端 
口 ， 遵 循 由 联合 测试 工作 组 (Joint Test Action Group ) 制定 的 IEEE 标准 。 


A.12 现场 可 编程 门 阵列 

最 通用 的 可 编程 逻辑 器 件 称 为 现场 可 编程 门 阵列 (Field-Programmable Gate Array， 
FPGA )。 图 A-45 给 出 了 FPGA 的 概念 框图 。 它 由 一 个 逻辑 块 ( 表示 为 较 大 的 黑 框 ) 阵列 组 
成 ， 这 些 逻 辑 块 可 以 由 通用 互 连 资源 连接 。 互 连 开关 . (interconnect ) 用 较 小 的 方块 表示 ， 由 导 
线 和 可 编程 开关 组 成 。 这 些 开 关 用 于 连接 逻辑 块 和 导线 ， 以 及 在 不 同 导线 之 间 建 立 所 需 的 连 
接 。 这 给 予 了 芯片 很 大 的 路 由 灵活 性 。1/O 块 为 芯片 管 脚 的 访问 提供 了 输入 和 输出 缓冲 器 。 

逻辑 块 和 互 连 结构 的 设计 是 多 种 多 样 的 。 人 逻辑 块 可 能 只 是 A.10 节 中 简单 的 基于 多 路 复 用 
器 的 电路 ， 可 以 实现 逻辑 函数 。 另 一 种 流行 的 设计 是 将 简单 的 查找 表 ( Lookup Table，LUT ) 
作为 逻辑 块 。 例 如 ， 一 个 4 输入 的 LUT 可 以 用 16 位 存储 电路 实现 ， 该 电路 存储 逻辑 函数 的 真 
值 表 。 每 个 存储 位 对 应 于 输入 变量 的 真 值 或 反 值 的 一 个 组 合 。 对 这 样 的 查找 表 编 程 可 以 实现 4 
变量 的 任何 函数 。 逻 辑 块 可 能 会 包含 触发 器 ， 以 提供 类 似 图 A-43 中 额外 的 灵活 性 。 

除了 逻辑 块 ， 许 多 FPGA 忌 片 还 包含 相当 数量 的 存储 单元 (图 A-45 中 没有 显示 )， 可 以 
实现 诸如 先进 先 出 (FIFO ) 队列 或 片上 系统 的 RAM 和 ROM 组 件 等 结构 ， 这 些 在 第 11 章 进 
行 了 讨论 。 

FPGA 可 用 于 多 种 规格 中 。 最 大 的 器 件 包含 数 十 亿 的 晶体 管 ， 可 以 用 来 实现 很 大 的 逻辑 
电路 。FPGA 的 不 断 普 及 是 因为 它 允 许 设 计 者 在 一 块 世 片上 实现 非常 复杂 的 逻辑 电路 ， 而 无 需 
设计 制造 定制 的 VLSI 芯片， 这些 芯片 非常 昂贵 而 且 费 时 。 使 用 CAD 工具 可 以 在 几 天 内 完成 
FPGA 的 设计 ， 而 制造 定制 VLSI 老 片 需要 花费 几 个 月 的 时 间 。 关 于 使 用 FPGA 器 件 和 CAD . 
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工具 进行 电路 设计 的 引导 性 讨论 ， 读 者 可 以 查阅 参考 文献 [1]。 


































































































图 A-45” FPGA 的 概念 框图 


A.13 时序 电路 


组 合 电路 的 输出 完全 由 当前 的 输入 决定 。A.9 节 和 A.10 节 给 出 的 译 码 器 和 多 路 复 用 器 就 
是 组 合 电路 的 例子 。 另 一 类 电路 的 输出 是 由 当前 的 输入 和 以 前 的 输入 序列 共同 决定 。 它 们 称 为 
时 序 电 路 (sequential circuit )。 这 样 的 电路 可 以 处 于 不 同 的 状态 ( state )， 这 些 状 态 由 给 定时 间 
内 的 输入 序列 决定 。 电 路 的 状态 决定 了 电路 在 不 同 输入 模式 下 的 行为 。 在 A.7 节 和 A.8 节 中 ， 
我 们 曾经 遇 到 这 种 电路 的 两 种 具体 形式 : 移 位 寄存 器 和 计数 器 。 本 节 将 介绍 时 序 电 路 的 一 般 形 
式 ， 并 简单 介绍 这 类 电路 的 设计 方法 。 


A.13.1 升值 / 降 值 计数 器 的 时 序 电路 设计 

图 A-34 给 出 了 由 三 个 工 触发 器 实现 的 升值 计数 器 的 结构 ， 按 照 0, 1, 2,…, 7, 0, … 的 顺序 
计数 。 也 可 以 用 类 似 的 电路 实现 降 值 计数 ， 即 按 0, 7, 6, …, 1, 0, … 计 数 (见习 题 A.26 )。 这 些 
简单 的 电路 都 利用 了 T 触发 器 的 翻转 性 质 - 

下 面 考虑 一 下 使 用 D 触发 器 实现 计数 器 的 可 能 性 。 我 们 将 设计 一 个 既 能 升值 计数 也 能 降 
值 计 数 的 计数 器 作为 具体 的 例子 ， 升 值 或 降 值 由 一 个 外 部 控制 输入 的 值 决 定 。 为 了 使 这 个 例子 
简单 一 点 ， 我 们 将 计数 器 限制 为 模 4 计数 器 ， 它 只 需要 两 个 状态 位 来 表示 四 个 可 能 的 计数 值 。 
下 面 将 说 明 如 何 使 用 构造 时 序 电路 的 基本 方法 来 设计 这 个 计数 器 。 所 需 电 路 在 输入 信号 x 为 0 
时 进行 升值 计数 ，x 为 1 时 进行 降 值 计数 。 使 用 图 A-27 和 图 A-28 中 所 介绍 的 D 触发 器 ,计数 
发 生 在 时 钟 信号 的 下 降 沿 。 假 设 我 们 对 计数 为 2 时 的 状态 感 兴趣 ， 则 输出 信号 z 在 计数 为 2 时 
为 1， 而 在 其 他 时 刻 都 为 0。 
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这 个 计数 器 可 以 作为 时 序 电 路 实现 。 当 一 个 时 钟 脉冲 到 来 时 ， 为 了 确定 新 的 计数 ， 知 道 
x 的 值 和 当前 的 计数 值 就 够 了 。 我 们 无 需 知道 先前 输入 值 的 实际 顺序 ， 而 只 需 知 道 当前 的 计数 
值 。 这 个 计数 值 决定 了 电路 的 当前 状态 (present state )， 这 是 电路 保存 的 关于 先前 输入 的 唯一 
言 息 。 如 果 现 在 的 计数 是 2 并 且 x = 0， 下 一 个 计数 就 是 3。 从 3 降 值 计数 或 从 1 升值 计数 到 2 
没有 任何 区 别 。 

在 给 出 电路 实现 之 前 ， 我 们 先 用 状态 图 描述 计数 器 所 需 的 行为 。 计 数 器 具有 4 个 不 同 的 
状态 : S0，S1，S2 和 S3。 状 态 图 (state diagram ) 是 用 圆圈 ( 有 时 称 为 节点 ) 表示 状态 的 图 。 
状态 之 间 的 转换 用 带 标记 的 箭头 表示 。 与 箭头 对 应 的 标记 指示 了 会 使 特定 转换 发 生 的 输入 zx 的 
值 。 图 A-46 显示 了 这 个 升值 / 降 值 计数 器 的 状态 图 。 例 如 ， 从 状态 S1 (计数 值 = 1 ) 发 出 的 
箭头 在 输入 x= 0 时 指向 状态 S2， 这 表示 向 状态 S2 的 转变 。 从 S2 到 S3 的 箭头 表明 当 x=0 
时 ， 下 一 个 时 钟 脉冲 会 发 生 从 状态 S2 到 状态 S3 的 转变 ， 并 且 当 电路 在 状态 S2 时 ， 输 出 z 必 
是 1， 而 在 状态 SO、S1 和 S3 时 ， 输 出 z 必 为 0, 图 中 的 每 个 圆圈 表明 了 这 种 情况 。 





























x=0 
ps re 
see 下 一 状态 
x=0 x=0 当前 状态 en Te 输出 z 
| = 
SO Sl | S3 0 
Sl S2 S0 0 
| 33 S0 S2 0 
X=0 | | | 
图 A-46 检测 计数 2 的 模 4 升值 / 降 值 计 数 器 状态 图 图 A-47 升值 / 降 值 计数 器 例子 的 状态 表 


注意 ， 状 态 图 描述 了 计数 器 的 功能 行为 ， 而 并 没有 提 及 它 如 何 实现 。 岁 A-46 可 以 用 来 描 
述 按 这 种 方式 表现 的 电子 数字 电路 、 机 械 计数 器 或 者 计算 机 程序 。 状 态 图 是 描述 具有 时 序 行为 
的 任何 系统 的 有 力 工 具 。 

表示 状态 图 信息 的 另 一 种 方法 是 使 用 状态 表 ( state table )。 图 A-47 给 出 了 图 A-46 例子 的 
状态 表 。 表 中 显示 了 在 输入 x 下 ， 从 所 有 当前 状态 到 下 一 状态 (next state ) 的 转换 。 表 中 还 显 
示 了 每 个 状态 中 输出 信号 z 的 值 。 

我 们 已 经 描述 了 一 般 条 件 下 的 升值 / 降 值 计数 器 ， 现 在 考虑 它 的 实现 。 对 表示 计数 值 的 
4 个 状态 进行 编码 需要 两 个 位 。 设 这 两 个 位 为 yy (高位) 和 yy (低位 )。 计 数 器 的 状态 由 六 和 
1 的 值 决定 ， 我 们 将 它 写成 yy yi 的 形式 并 给 y, y1 赋值 为 : S0 = 00,S1=01,，S2=10 和 S3= 
11。 这 样 安排 使 得 二 进 制 数 yy 可 以 明显 地 表示 计数 值 。 变 量 y, yi 称 为 时 序 电 路 的 状态 变量 
( state variable )。 使 用 这 一 状态 分 配 (state assignment )， 图 A-48 给 出 了 我 们 所 举例 子 的 状态 
表 。 注 意 使 用 变量 丈 和 蕊 来 表示 下 一 状态 ， 它 们 的 用 法 与 表示 当前 状态 的 思 和 六 一样。 

需要 注意 的 很 重要 的 一 点 是 ， 我 们 可 以 选择 另 一 种 不 同 的 状态 对 yy 进行 赋值 。 例 如 ， 
可 能 赋值 为 S0 = 10，S1 = 11，S2 = 01，S3 = 00。 对 于 一 个 计数 器 电路 来 说 ， 这 种 赋值 方式 没 
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有 图 A-48 直观 ， 但 是 结果 电路 仍然 会 运行 正常 。 通 常 ， 使 用 不 同 状态 赋值 方式 实现 电路 的 成 
本 也 不 相同 ( 见习 题 A.30 )。 

我 们 举 这 个 例子 的 目的 是 使 用 D 触发 器 存储 连续 
时 钟 脉 冲 间 的 两 个 状态 变量 的 值 。 触 发 器 的 输出 Q 是 
当前 状态 变量 y, 输入 DD 是 下 一 状态 变量 %。 注意 了 
是 饭 、y 和 x 的 函数 ， 如 图 A-48 所 示 。 从 图 中 我 们 可 
以 看 到 











7 Sa yay1x hs yp1x 中 yap1x 丰 yy1X 





=y Dy Dx 
Y= x+ yx + px t+ yx 
= 
输出 z 由 式 子 图 A-48 ”图 A-47 中 例子 的 状态 分 配 


2Z 三] 区 
决定 。 这 些 表达 式 形成 了 图 A-49 所 显示 的 电路 。 





图 A-49 升值 / 降 值 计数 器 的 实现 


A.13.2 ”时 序 图 


了 解 计数 器 的 时 序 图 有 助 于 完全 掌握 计数 器 电路 的 操作 。 图 A-50 给 出 了 一 个 可 能 事件 序 
列 的 例子 。 假 设 状态 转换 ( 触发 器 的 值 改变 ) 发 生 在 下 降 沿 ， 并 且 计数 器 从 状态 S0 开始 。 因 
为 x = 0， 计数器 在 时刻 变 为 状态 S1， 时 刻 变 为 S2，& 时 刻 变 为 S3。 当 计数 器 进入 状态 
S2 时 ， 输 出 从 0 变 到 1。 当 达到 状态 S3 时 又 变 到 0。 在 5 时刻， 计数 器 返回 S0 状态 。 假 设 在 
这 一 时 刻 ， 输 入 x 变 为 1， 导致 计数 器 降 值 计数 。 当 计数 再 一 次 达到 S2 时 ， 即 在 吉 时 刻 ， 输 
出 z 变 为 1。 

注意 所 有 信和 号 改变 都 在 时 钟 下 降 沿 之 后 立刻 发 生 ， 并 在 下 一 个 下 降 沿 到 来 之 前 不 会 发 生 
改变 。 从 时 钟 边沿 到 变量 y; 改变 之 间 的 延迟 是 实现 计数 器 电路 触发 器 的 传输 延迟 。 还 要 注意 
我 们 假设 输入 x 也 由 同一 个 时 钟 控制 ， 并 且 它 的 转变 只 发 生 在 临近 时 钟 周期 开始 的 时 刻 。 这 是 
所 有 改变 均 由 一 个 时 钟 控制 的 电路 的 基本 性 质 。 这 样 的 电路 称 作 同 步 时 序 电路 ( synchronous 
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sequential circuit )。 


人 S3 8S0 8S3 S2 Ss1 S0 
图 A-50 图 A-49 所 示 电 路 的 时 序 图 


为 一 个 关注 的 重点 是 图 A-46 中 状态 图 使 用 的 标记 与 时 序 图 的 关系 。 例 如 ， 考 虑 4 与 之 
间 的 时 钟 周期 。 在 这 个 周期 内 ， 机 器 处 于 S2 状态 且 输 入 值 x= 0。 这 一 情况 在 状态 图 中 用 从 S2 
状态 发 出 标号 为 x= 0 的 箭头 表示 。 因 为 这 个 箭头 指向 S3 状态 ， 所 以 时 序 图 显示 了 在 下 一 时 钟 
边沿 时 ,ys 和 六 变 为 S3 状态 相应 的 值 。 


A.13.3 ”有 限 状态 机 模型 

图 A-49 中 使 用 触发 器 和 组 合 逻辑 门 的 同步 时 序 电路 实现 升值 / 降 值 计数 器 的 具体 例子 很 
容易 概括 为 图 A-51 中 的 标准 有 限 状 态 机 ( finite state machine ) 模型 。 在 这 个 模型 中 ， 延 迟 元 
件 的 时 间 延 迟 等 于 时 钟 周期 的 长 度 。 这 就 是 匀 发 生变 化 到 相应 的 y 发 生变 化 的 时 间 。 模 型 假 
设 组 合 逻 辑 块 没 有 延迟 ; 因此 ,输出 z、 了 7 和 二 是 输入 x、y 和 yy; 的 瞬 态 函数 。 实 际 电路 中 的 
触发 器 会 产生 一 些 延迟 ， 如 图 A-50 所 示 。 如 果 组 合 逻辑 块 的 延迟 与 时 钟 周期 相 比 很 小 的 话 ， 
电路 就 能 正常 工作 。 下 一 状态 的 输出 必须 及 时 到 位 以 使 触发 器 能 在 时 钟 周期 末尾 改变 到 下 
一 所 需 状 态 。 

组 合 逻 辑 块 的 输入 由 表示 当前 状态 的 触发 器 输出 y; 和 外 部 输入 x 组 成 ， 其 输出 是 触发 器 
输入 和 外 部 输出 z。 当 有 效 时 钟 边沿 到 来 结束 当前 时 钟 周期 时 ，Y 线 的 值 被 写 人 触发 器 。 它 
成 为 状态 变量 y; 的 下 一 组 值 。 因 为 这 些 
信号 连接 在 组 合 块 的 输入 端 上 ， 所 以 它 
们 和 外 部 输入 x 将 产生 新 的 z 和 7 值 。 
一 个 时 钟 周期 过 去 之 后 ， 新 的 8 值 被 
传送 给 y;， 如 此 反复 。 换 句 话 说 ， 触 发 
器 形成 了 组 合 块 从 输出 到 输入 的 反馈 回 
路 ， 并 引入 了 一 个 时 钟 周 期 的 延迟 。 

尽管 图 A-51 中 只 显示 了 一 个 外 部 
输入 ， 一 个 外 部 输出 和 两 个 状态 变量 ， 
但 是 显而易见 ， 这 可 以 扩展 成 有 多 个 输 延迟 元 件 〔 触 发 器 ) 

入 、 输 出 和 状态 变量 的 情况 。 图 A-51 有 限 状态 机 的 标准 模型 
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A.13.4 有 限 状态 机 的 组 合 

让 我 们 总 结 一 下 设计 具有 图 A-51 基本 结构 的 同步 时 序 电路 的 步骤 : 

1 ) 列 出 适当 的 状态 图 和 状态 表 。 

2 ) 确定 所 需 触发 器 的 数目 ， 选 择 合适 类 型 的 触发 器 。 

3 ) 确定 状态 图 中 的 每 个 状态 需要 在 触发 器 中 存储 的 值 。 这 称 为 状态 分 配 。 

4) 列 出 状态 赋值 表 。 

5 ) 推导 出 控制 触发 器 输入 的 下 一 状态 逻辑 表达 式 。 另 外 ， 也 推导 出 电路 输出 的 表达 式 。 

6 ) 使 用 得 到 的 表达 式 实现 电路 。 

时 序 电 路 可 以 很 容易 地 用 CPLD 和 FPGA 实现 ， 因 为 这 些 器 件 既 包括 触发 器 又 包括 组 合 
逻辑 门 。 现 代 的 计算 机 辅助 设计 工具 可 以 直接 根据 状态 图 的 描述 合成 时 序 电 路 。 

我 们 讨论 的 时 序 电路 都 是 在 同一 时 钟 的 控制 下 工作 。 不 使 用 时 钟 也 可 以 实现 时 序 电路 。 
这 样 的 电路 称 为 异步 时 序 电路 ( asynchronous sequential circuit )。 它 们 的 设计 不 像 同 步 时 序 电 路 
这 样 直 接 。 为 了 对 两 种 时 序 电 路 有 完整 的 了 解 ， 可 以 参考 专门 介绍 逻辑 设计 的 书籍 [1 ~ 7]。 


A.14 ”结束 语 

本 附录 的 主要 目的 是 使 读者 了 解 邮 辑 设计 的 基本 概念 和 计算 机 体系 结构 中 普遍 使 用 的 电 
路 结构 。 熟 悉 了 这 些 知 识 就 可 以 更 好 地 掌握 在 本 书 主要 章节 中 介绍 的 体系 结构 概念 。 正 如 我 们 
多 次 提 到 的 ， 逻 辑 电 路 的 详细 设计 需要 借助 CAD 工具 。 这 些 工 具 考虑 了 许多 细节 问题 ， 可 以 
被 经 验 丰 富 的 设计 人 员 有 效 地 利用 。 

IC 技术 和 CAD 工具 的 使 用 彻底 改革 了 逻辑 设计 。 市 场 上 各 种 IC 组 件 的 成 本 不 断 降 低 ， 而 
且 新 的 发 现 和 技术 的 发 展 一 直 在 进行 。 这 个 附录 介绍 了 在 数字 系统 设计 中 一 些 有 用 的 基本 组 件 。 


习题 
[E] A.1 使 用 积 之 和 形式 实现 COINCIDENCE 函数 ， 其 中 COINCIDENCE = XOR。 
[M] A.2 使 用 数学 公式 和 真 值 表 证 明 下 列 等 式 : 
(a)a®@b@c=abc+abc+abc+abc 
(b)x+wri=x+w 
(C) xia + XX3 + XK) = XIX2 + XX 


[E] A3 图 PA-1 给 出 了 4 个 3 变量 函数 /所 的 最 小 积 之 和 形 





式 。 这 些 函 数 还 有 其 他 形式 的 最 小 表达 式 吗 ? 如 果 有 ， 将 09” 区 地 qd 
它们 都 写 出 来 - 人 
[E] A.4 利用 无 关 项 d 找 出 函数 /的 最 简 积 之 和 形式 ， 其 中 0 1 1 1 
f= Xray + Xax3 + Xaxyxa) + Xaxs(X3 + x1) 1 0 0 d 
d = Xr + Bd) + KI a , 
[M] A.5 考虑 下 面 的 滑 数 ee 1 
fx Xa) = Dx) + (Xx + KT) + XX 
(a ) 使 用 卡 诺 图 找到 /的 最 小 成 本 积 之 和 ( SOP ) 表达 式 。 图 PA-1 习题 A.3 的 逻辑 函数 


(b ) 找到 /的 互补 项 1 的 SOP 表达 式 ， 然 后 (使 用 德 摩根 律 ) 对 这 个 SOP 表达 式 取 反 ， 找 到 j 的 
表达 式 。 得 到 的 结果 表达 式 应 该 是 和 之 积 形式 (POS )。 将 它 与 (a ) 中 所 得 的 SOP 表达 式 
的 成 本 进行 比较 。 你 可 以 从 中 得 到 什么 结论 ? 
[E] A.6 写 出 函数 ,jxo, xxs) 的 最 小 成 本 实现 ， 其 中 如 果 一 个 或 两 个 输入 逻辑 变量 是 1 时 ,f= 1， 和 否则 
/=0. 


附录 A 逻辑 电路 : 341 


[M] A.7 图 A-6 定义 了 一 个 4 位 BCD 码 数字 。 设 计 一 个 电路 ， 它 有 4 个 输入 ， 标 记 为 b;, …, po 和 一 个 输 
出 六 其 中 4 位 输入 模式 是 有 效 BCD 数 时 ,f= 1; 否则 广 0。 给 出 这 个 电路 的 最 小 成 本 实现 。 
[M] A.8 两 个 2 位 数 4=aiao 和 B= bibo 由 4 变量 函数 f(ai, ao, bi, po) 进行 比较 。 当 满 足 
v (4A) < v(B) 
时 ， 函 数 的 值 为 1。 其 中 对 任意 2 位 数 ，v (加 = xi x 21 + xox2"。 假设 变量 4 和 B 满 足 |v (4)- 
v (8B)| 入 2。 使 用 最 少 的 门 实现 大 
[M] A.9 重复 习题 A.8， 要 求 当 v (CD)> v(8) 时 ， 函 数 ,[= 1; 其 输入 满足 v(4)+v(B8) < 4。 
[E] A.10 证 明 结 合 率 不 适用 于 与 非 (NAND ) 操作 符 。 
[M] A.11 使 用 与 非 门 (不 超过 6 个 ) 实现 下 面 的 函数 ， 每 个 门 有 三 个 输入 。 假 设 这 三 个 输入 的 真 值 和 反 
值 都 可 用 。 


f= XX2t XXX3 十 XXIXIN4 + XIXIXIXA 








二 进 制 码 输出 





















[M] A.12 使 用 6 个 或 更 少 的 2 输入 与 非 门 实现 下 面 肾 数 。 不 
能 使 用 输入 变量 的 反 值 。 | 
f=xx2t+ Xt Xxa 0 0 SE 0 © 
[E] A.13 只 使 用 与 非 门 ， 尽 可 能 经 济 地 实现 下 面 的 函数 。 不 0 i 
允许 使 用 输入 变量 的 反 值 。 0 1 0 1 0 
fF(x1it+ x3) (K+ Xa) 0 1 和 下 了 
[M] A.14 使 用 二 进 制 表 示 的 连续 数字 间 只 有 1 位 不 同 的 数字 1 于 1 0 0 
码 称 为 Gray 码 。3 位 Gray 码 和 二 进 制 码 变换 的 真 1 1 i Wm 1 
值 表 如 图 PA-2a 所 示 。 1 1 1 4 
(a ) 只 使 用 与 非 门 实现 函数 fi, f, fi。 2 i 
(b ) 注意 到 下 列 输入 和 输出 变量 的 关系 ， 可 以 使 这 a ) 3 位 Gray 码 到 二 进 制 码 的 转换 
一 码 制 转换 的 网 络 成 本 更 低 。 a b c 
fi=a | 
f=fiBb 
.= 户 由 c 


使 用 这 些 关系 ， 指 明 可 重复 的 组 合 网 络 N 的 内 
容 ， 如 图 PA-2b 所 示 ， 从 而 实现 转换 。 比 较 这 
种 形式 下 实现 转换 所 需 的 与 非 门 数量 与 (a) 部 
分 中 的 与 非 门 总 数 。 
[M] A.15 使 用 4 个 2 输入 与 非 门 实现 异 或 函数 。  . 图 PA-2 习题 A.14 Gray 码 转换 的 例子 
[M] A.16 图 A-36 定义 了 一 个 BCD 码 七 段 显示 器 译 码 器 。 使 用 与 、 或 、 非 门 给 出 该 真 值 表 的 实现 。 证 明 
其 与 图 中 的 与 非 门 电 路 实现 了 同样 的 功能 。 
[M] A.17 在 图 PA-3 的 逻辑 网 络 中 ， 门 3 出 现 故障 ， 不 管 输入 为 何 值 ， 其 输出 Fl 都 产生 逻辑 值 1。 重 新 
画 出 网 络 图 ， 尽 可 能 化 简 ， 用 最 少 的 门 实现 一 个 与 所 给 有 故障 网 络 等 价 的 新 网 络 。 假 设 错误 出 
在 F2， 它 被 锁定 在 逻辑 值 0， 重 复 此 问题 。 


b ) 码 制 转换 网 络 





图 PA-3 一 个 有 故障 的 网 络 
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[M] A.18 图 A-16 显示 了 普通 CMOS 电路 的 结构 。 设 计 一 个 CMOS 电路 实现 下 列 函 数 。 
fi, Xa) = XIX + Xx 
尽 可 能 少 用 晶体 管 。( 提示 : 考虑 晶体 管 的 串联 /并 联网 络 。 注 意图 A-17 和 图 A-18 中 上 拉 和 下 
拉 网 络 相反 的 串联 和 并 联结 构 。) 
[E] A.19 画 出 图 A-30 中 承 电路 输出 Q 的 波形 ， 利 用 图 PA-4 的 输入 波形 并 假设 触发 器 开始 处 于 0 状态 。 
[E] A.20 写 出 图 PA-5 中 与 非 门 电路 的 真 值 表 。 将 其 与 图 A-23b 中 的 真 值 表 比 较 ， 然 后 证 明 图 A-25 中 的 
电路 与 图 A-24a 中 的 电路 等 价 。 
[M] A.21 以 或 非 门 的 延迟 为 单位 ， 计 算 图 A-28 中 下 降 沿 触发 的 D 触发 器 的 建立 时 间 和 保持 时 间 。 


Clock ] | | | | | | | | | | 

0 
1 A Q 

J 
0 
1 

K = 
0 B Q 

图 PA-4 区 触发 器 的 输入 波形 图 PA-5 与 非 锁 存 器 
[M] A.22 在 图 A-26a 的 电路 中 ， 用 或 非 门 代替 所 有 的 与 非 门 。 写 出 结果 电路 的 真 值 表 。 这 个 电路 与 

图 A-26a 中 的 电路 有 何不 同 ? 


[M] A.23 图 A-32 显示 了 一 个 在 时 钟 信号 控制 下 每 次 将 数据 右 移 一 位 的 移 位 寄存 器 网 络 。 改 进 这 个 移 位 寄 
存 器 ， 使 它 能 够 在 时 钟 和 附加 控制 输入 ONE/TWO 的 共同 作用 下 每 次 将 数据 移动 一 位 或 两 位 。 

[D] A.24 我 们 需要 一 个 4 位 移 位 寄存 器 ， 它 有 两 个 控制 输入 端 一 -INITIALIZE 和 RIGHT/LEFT。 当 
INITIALIZE 置 为 1 时， 二进制 数 1000 被 写 人 寄存 器 ， 而 与 时 钟 输入 无 关 。 当 INITIALIZE = 0 
时 ， 时 钟 输入 的 脉冲 将 这 个 模式 循环 移 位 。 当 RIGHT/LEFT 的 输入 等 于 1 或 0 时 ， 这 个 模式 分 
别 循环 右 移 或 循环 左 移 。 使 用 图 A-31 中 具有 预 置 和 清除 输入 的 D 触发 器 ， 给 出 这 个 寄存 器 的 
合理 设计 。 

[M] A.25 构造 一 个 3 输入 8 输出 的 译 码 器 网 络 ， 所 使 用 的 门 输入 不 得 超过 2 个 。 

[D] A.26 图 A-34 显示 了 一 个 3 位 升值 计数 器 。 按 相反 顺序 ( 即 7, 6, …, 1, 0, 7, … ) 计数 的 计数 器 称 为 降 

” 值 计数 器 。 能 在 UP/DOWN 信号 的 控制 下 按 两 种 顺序 计数 的 计数 器 叫做 升值 / 降 值 计 数 器 。 画 

出 一 个 3 位 升值 / 降 值 计数 器 的 逻辑 图 ， 它 能 从 外 部 源 并 行 加 载 触发 器 ， 从 而 可 以 被 预 置 为 任 
何 状 态 。LOAD/COUNT 控制 用 来 决定 计数 器 是 被 加 载 还 是 做 计数 操作 。 

[D] A.27 图 A-34 显示 了 一 个 异步 的 3 位 升值 计数 器 。 设 计 一 个 4 位 同步 升值 计数 器 ， 按 0, 1, 2, …, 15， 
0, … 的 顺序 计数 。 在 电路 中 使 用 T 触发 器 。 在 同步 计数 器 中 ， 所 有 的 触发 器 都 能 同时 改变 它们 
的 状态 。 因 此 ， 主 时 钟 输入 应 直接 与 所 有 触发 器 的 时 钟 输入 相连 。 

[M] A.28 实现 如 下 表达 式 描述 的 逻辑 函数 

f (Xi1, Xa, X3, Xa) = DC3X4 十 3X4 十 XXX34 

(a) 使 用 8 输入 多 路 复 用 器 电路 实现 / 
(b) 可 以 用 4 输入 多 路 复 用 器 实现 f 吗 ? 如果 可 以 ,请 写 出 方法 。 

[M] A.29 当 

f (xX1, X2, X3, Xa) = XIX2X3 + XXIX4 + KIX4 

时 重复 习题 A.28。 

[E] A.30 使 用 状态 分 配 S0 = 10，S1 = 11，S2 = 01，S3 = 00 完成 对 图 A-46 中 升值 / 降 值 计数 器 的 设计 。 
这 个 设计 与 A.13.1 节 的 有 什么 不 同 ? 

[M] A.31 使 用 DD 触发 器 设计 一 个 如 图 A-49 所 示 形 式 的 2 位 同步 计数 器 ， 按 照 …0, 3, 1, 2, 0, … 的 顺序 计 
数 。 这 个 电路 没有 外 部 输入 ， 输 出 是 触发 器 自己 的 值 。 
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[M] A.32 重复 习题 A.31， 设 计 一 个 按照 …0, 1, 2, 3, 4, 5, 0, … 计 数 的 3 位 计数 器 - 设计 组 合 逻辑 时 ， 将 未 
使 用 的 计数 值 6 和 7 作为 无 关 项 。 

[M] A.33 有 限 状 态 机 可 以 用 来 检测 输入 到 机 器 的 二 进 制 序 列 中 某 些 子 序列 的 发 生 情 况 。 这 样 的 机 器 称 为 
有 限 状 态 识别 器 ( finite state recognizer )。 假 设 每 当 出 现 输入 模式 011 ， 机 器 就 产生 输出 1。 
(a) 画 出 这 台 机 器 的 状态 网 。 
(b ) 假设 使 用 DD 触发 器 ， 为 所 需 数目 的 触发 器 进行 状态 分 配 并 构造 分 配 状态 表 。 
(c ) 写 出 输出 变量 和 下 一 -状态 变量 的 逻辑 表达 式 。 

[M] A.34 机 器 在 输入 序列 中 识别 子 序列 011 和 010， 包 括 重 倒 出现 的 情况 。 重 复习 题 A.33 的 (a ) 部 分 。 
例如 ， 当 输入 序列 是 1101010110… 时 产生 的 输出 序列 是 00000101010…。 
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附录 目标 

在 本 附录 中 ， 你 将 学 习 Altera Nios [I 处 理 器 ， 它 具有 RISC 风格 的 指令 集 。 本 附录 主要 讨论 : 

e 指令 集体 系 结构 

e 输入 /输出 能 力 

e 支持 伐 人 式 应 用 

在 第 2 和 第 3 章 中 ,我 们 主要 从 程序 员 的 角度 介绍 了 指令 集 设计 中 所 使 用 的 基本 概念 。 
在 本 附录 中 ， 我 们 将 研究 Altera 公司 的 Nios [I 处理 器 ， 它 是 能 体现 前 面 所 讨论 概念 的 RISC 风 
格 商业 产品 的 一 个 例子 。 本 附录 的 讨论 与 第 2 和 第 3 章 所 介绍 的 主题 非常 相似 。 

Nios II 处 理 器 是 在 现场 可 编程 门 阵 列 (FPGA ) 器 件 (参见 附录 A ) 中 实现 的 。 它 以 软件 
的 形式 提供 ， 通 过 使 用 Altera 公司 提供 的 Quartus I CAD ( 计算 机 辅助 设计 ) 工具 可 以 很 容易 
地 将 其 合并 到 计算 机 系统 中 。 然 后 ， 将 所 设计 的 系统 下 载 到 FPGA 器 件 中 ， 这 样 就 可 以 实现 一 
个 具有 典型 功能 的 计算 机 系统 。 

Quartus II 软件 包括 一 个 称 为 SOPC Builder 的 工具 ,该 工具 可 用 来 设计 SOPC 系统 。SOPC 
Builder 提供 了 多 种 预先 设计 的 模块 ， 称 为 卫 内 核 (IP core )， 它 们 可 以 很 容易 地 添加 到 一 个 系 
统 中 。 这 些 模块 包括 Nios II 处 理 器 、 各 种 IO 接口 和 存储 器 控制 器 。 这 些 模块 的 特点 是 有 各 种 
参数 ， 以 允许 设计 自 定义 系统 的 用 户 指定 所 需 系 统 的 确切 性 质 。Nios II 处 理 器 可 以 配置 为 具有 
多 种 不 同 的 特性 ， 每 种 特性 需要 不 同 数量 的 逻辑 电路 来 实现 ， 从 而 会 影响 最 终 系统 的 性 能 和 成 
本 。 由 于 用 户 可 以 自 定 义 最 终 电 路 的 设计 ， 所 以 我 们 说 Nios II 是 个 软 处 理 器 (soft processor )。 

设计 一 个 自 定义 的 、 可 在 单个 FPGA 芯片 上 实现 的 计算 机 系统 的 能 力 ， 在 散人 入 式 应 用 中 
是 很 有 吸引 力 的 。 我 们 在 第 11 章 中 讨论 了 此 类 应 用 。 


B.1 Nios | 的 特征 

Nios I 革 处理 器 具有 RISC 风格 的 体系 结构 ， 其 特点 大 体 上 与 第 2 章 中 所 描述 的 非常 相似 。 

1. 数据 大 小 

字 长 为 32 位。 数据 是 以 32 位 的 字 (word)、16 位 的 半 字 (halfword )， 或 者 8 位 的 字 节 
( byte ) 为 单位 进行 处 理 的 。 一 个 字 中 的 字 节 地 址 是 按 小 端 方式 进行 分 配 的 ， 即 低 字 节 地 址 用 
于 最 低 有 效 位 的 字 节 。 

2. 存储 器 访问 

存储 器 中 的 数据 只 能 通过 Load 和 Store 指令 进行 访问 ， 它 们 将 数据 装 人 通用 寄存 器 中 
或 者 将 寄存 器 中 的 数据 进行 存储 。Load 和 Store 指令 可 以 以 字 、 半 字 或 字 节 为 单位 进行 数据 
传输 。 

3. 寄存 器 

Nios II 有 32 个 通用 寄存 器 和 一 些 控制 寄存 器 。 所 有 寄存 器 的 长 度 都 是 32 位 的 。 

4. 指令 


所 有 指令 的 长 度 都 是 32 位 的 。 它 们 具有 第 2 章 介绍 的 所 有 RISC 风格 功能 。 
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B.2 ”通用 寄存 器 





表 B-1 显示 了 处 理 器 的 32 个 通用 寄存 器 ， 它 们 表 B-1 Nios | 通用 寄存 器 
被 称 为 r0 到 r31， 这 是 在 汇编 语言 指令 中 使 用 的 名 称 。 ”寄存 器 功 能 
一 些 寄存 器 用 于 特定 的 用 途 ， 央 此 给 它们 赋予 更 能 指 。_w 0x00000000 
示 其 功能 的 名 称 ， 如 表 B-1 所 示 。 这 些 名称 也 可 由 汇 上 汇编 程序 临时 寄存 器 
编程 序 识别 。 用 于 特定 用 途 的 寄存 器 有 : | | 
。10 始终 包含 常数 0。 读 取 该 寄存 器 将 返回 值 0; 3 | | 
er a 
e rl 被 汇编 程序 用 作 临 时 寄存 器 。 不 应 该 在 用 户 D4 | a | 认 闪 从 时 冤 存 吕 
程序 中 使 用 它 。 可 断 点 临时 客 存 加 
。 r24 和 r29 用 于 异常 处 理 。 26 | 印 | 全 局 指针 
。 125 和 1I30 被 一 个 称 为 JTAG 调试 模块 的 调试 工 m27 | sp ”| 堆栈 指针 
具 专 门 使 用 。 28 结构 指针 
er26 是 全 局 指针 ， 指 向 用 户 程序 中 的 数据 。 ”m9 | ea | 异常 返回 地 址 
。127 是 处 理 器 堆栈 指针 。 0 | ba | 断 点 返回 地 址 
e I28 是 结构 指针 。 31 ra 返回 地 址 
e I31 保存 子 程序 调用 时 的 返回 地 址 。 


其 他 寄存 器 用 于 一 般 用 途 。 

因为 寄存 器 r0 始终 包含 值 0， 所 以 ,不 管 是 否 需 要 值 0， 它 都 可 以 作为 一 个 操作 数 包含 在 
指令 中 。 利 用 这 个 特点 可 以 对 其 进行 活用 。 例 如 ， 指 令 

add TS, r0, r0 

可 以 用 来 将 寄存 器 r5 清 0。 同 样 ，r0 可 以 是 Store 指令 中 的 源 操作 数 ， 用 来 将 一 个 存储 单元 清 
0。 在 Compare ( 比较 ) 与 Branch ( 转移 ) 指令 中 ， 当 要 将 另 一 个 寄存 器 中 的 值 与 0 进行 比较 
时 可 以 使 用 r0。 它 也 可 以 用 于 变 址 寻 址 方式 ， 以 提供 绝对 寻 址 方式 的 限制 版 本 。 

Nios II 处 理 器 还 有 一 些 控 制 寄 存 嚣 。 我 们 将 在 B.9 节 中 讨论 这 些 寄 存 器 ， 因 为 它们 主要 用 
于 输入 /输出 传输 。 


B.3 寻 址 方式 


Nios I 处 理 器 支持 以 下 五 种 寻 址 方式 : 
@ 立即 方式 (immediate mode ) 在 指令 中 明确 地 给 出 一 个 16 位 的 操作 数 ， 该 操作 数 
的 值 被 符号 扩展 为 32 位 ， 用 在 执行 算术 运算 的 指令 中 。 
@ 寄存 器 方式 〈Tregister mod ) 一 一 操作 数 是 一 个 通用 寄存 器 的 内 容 。 
@ 寄存 器 间接 方式 ( register indirect mode ) 操作 数 的 有 效 地 址 是 一 个 寄存 器 的 内 容 。 
e 位 移 方式 ( displacement mode ) 一 一 操作 数 的 有 效 地 址 是 通过 将 一 个 寄存 器 的 内 容 和 指 
令 中 给 出 的 一 个 16 位 有 符号 位 移 值 相 加 得 到 的 。 这 就 是 在 第 2 章 中 讨论 的 变 址 方式 。 
@ 绝对 方式 (absolute mode ) 通过 使 用 位 移 方式 以 及 寄存 器 r0 来 指定 一 个 16 位 的 操 
作 数 绝对 地 址 。 
表 B-2 给 出 了 寻 址 方式 及 其 汇编 语法 。 注 意 ， 这 里 立即 方式 的 语法 与 第 2 章 中 给 出 的 立即 方式 
不 同 ， 因 为 这 里 不 使 用 数字 符号 (#)。 相 反 的 是 ， 它 会 将 立即 数 规范 包含 到 操作 码 助 记 符 中 。 
例如 ， 指 令 
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addi r3,7r2,24 
将 2 的 内 容 与 十 进 制 立即 值 24 相 加 ， 并 将 结果 表 B-2 Nios || 寻 址 方式 
放 到 r3 中 。 
我 们 还 观察 到 ， 立 即 方式 与 绝对 方式 只 有 在 。 立即 方式 
立即 数 或 者 地 址 能 用 16 位 来 表示 时 才 可 以 使 用 。 寄存 器 方式 
我 们 将 在 B.4.4 节 和 B.4.5 节 中 分 别 讨 论 32 位 立 寄存 器 间接 方式 
即 数 和 地 址 的 问题 。 





B.4 指令 EA= 有 效 地 址 


、 saps 值 = 一 个 16 位 有 符号 数 
Nios [I 指令 集 举例 说 明了 第 2 童 讨论 的 。 人 16 作 的 有 符号 位 移入 
RISC 风格 处 理 器 的 所 有 特点 。 所 有 指令 的 长 度 一 一 一 一 
都 是 32 位 的 。 算 术 和 逻辑 运算 只 能 对 通用 寄存 器 中 的 操作 数 进 行 操 作 。Load 和 Store 指令 用 
来 在 存储 器 和 寄存 器 之 间 传 输 数 据 。 
指令 有 三 种 基本 形式 。 那 些 指 定 三 个 寄存 器 操作 数 的 指令 具有 以 下 形式 : 
Operation dest register, sourcel register, source2 register 
带 有 立即 操作 数 的 指令 形式 为 : 
Operation dest register, source register, iImmediate operand 
其 中 立即 操作 数 的 长 度 为 16 位 ， 可 以 对 其 进行 符号 扩展 以 提供 一 个 32 位 的 操作 数 。 第 三 种 形 
式 包 括 一 个 26 位 的 无 符号 立即 值 ， 它 只 用 于 子 程 序 调 用 指令 中 ， 如 : 
call LABEL 


B.4.1 标记 符号 

在 汇编 语言 程序 中 使 用 的 标记 符号 ( notation ) 受 一 个 特殊 的 汇编 程序 的 限制 ， 该 汇编 程 
序 用 来 将 源 程序 汇编 成 处 理 器 能 够 执行 的 机 器 代码 。 在 许多 汇编 程序 中 ， 都 假设 源 程 序 中 的 语 
句 不 区 分 大 小 写 。 这 意味 着 语句 

ADD R2,R3,R4 
和 
add  r2, TI3,r4 
是 等 价 的 。 但 是 Altera 公司 提供 的 Nios II 汇编 程序 并 不 是 这 样 。 该 汇编 程序 允许 操作 码 助 记 
符 不 区 分 大 小 写 ， 但 要 求 寄 存 器 的 名 称 为 小 写 。 因 此 ， 寄 存 器 必须 由 表 B-1 中 给 出 的 名 称 来 识 
别 。 例 如 ,我 们 可 以 使 用 r27 或 sp 来 表示 堆栈 指针 ， 但 不 能 使 用 R2 或 SP。 

在 Altera 公司 的 文档 资料 中 ， 小 写字 母 可 以 用 来 指定 操作 码 助 记 符 。 为 了 使 用 户 更 容易 
地 查阅 Altera 公司 的 文献 ， 我 们 将 在 本 附录 中 使 用 相同 的 约定 。 

Nios II 指令 集 是 相当 广泛 的 。 本 附录 中 ， 我 们 将 只 介绍 一 个 子 集 ， 它 足以 开发 一 个 可 理 
解 的 Nios II 处 理 器 。 为 了 使 后 面 的 介绍 更 易于 理解 ， 我 们 将 根据 其 功能 分 组 讨论 。 我 们 还 将 
展示 如 何 使 用 这 些 指令 来 实现 第 2 和 第 3 章 中 的 程序 示例 。 对 于 指令 集 的 完整 描述 ， 读 者 可 以 
查阅 Nios II 处 理 器 参考 手册 ， 这 可 以 在 Altera 公司 网 站 (altera.com ) 的 文献 部 分 中 找到 。 


B.4.2 Load 和 Store 指令 


Load 和 Store 指令 在 存储 器 或 IO 接口 和 通用 寄存 器 之 间 传 送 数据 。Load Word 指令 的 一 
般 形 式 为 
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ldw ri, source_operand 
例如 ， 指 令 
ldw r2, 40(r3) 
使 用 位 移 寻 址 方式 ， 通 过 将 十 进 制 数 40 和 寄存 器 r3 的 内 容 相 加 来 确定 存储 单元 的 有 效 地 址 ， 
然后 它 从 存储 器 中 读 出 这 个 32 位 的 操作 数 将 其 装 和 人 r2 中 。 有 效 地 址 必须 是 按 字 对 齐 的 ， 这 意 
味 着 它 必 须 是 4 的 倍数 。 
Store Word 指令 的 形式 为 
stw ri, destination operand 
例如 ， 指 令 
stw r2,40(r3) 
将 了 2 的 内 容 保存 到 上 述 的 同一 存储 单元 中 。 
汇编 语法 要 求 所 有 Load 和 Store 指令 中 的 存储 器 操作 数 使 用 位 移 寻 址 方式 X(ri) 来 指定 。 
这 就 允许 使 用 寄存 器 间接 方式 0(ri)， 简 写 为 (rij)， 以 及 绝对 方式 X(r0)。 但是， 即使 标签 的 值 
可 在 一 条 汇编 指示 ( assembler directive ) 中 定义 ， 绝 对 方式 也 不 能 只 使 用 一 个 标签 来 指定 。 因 
此 ,语句 
ldw  r2,LOCATION 
将 会 导致 一 个 语法 错误 。 
除了 字 大 小 的 操作 数 ，Load 和 Store 指令 也 可 以 处 理 字 节 大 小 和 半 字 大 小 的 操作 数 。 操 作 
数 的 大 小 在 操作 码 助 记 符 中 指示 。 这 样 的 Load 指令 有 : 
e ldb ( Load Byte， 加 载 字 节 ) 
e ldbu ( Load Byte Unsigned， 加 载 无 符号 字 节 ) 
e ldh( Load Halfword， 加 载 半 字 ) 
e@ ldhu (Load Halfword Unsigned， 加 载 无 符号 半 字 ) 
当 一 个 较 短 的 操作 数 被 装 入 一 个 32 位 的 寄存 器 中 时 ， 必 须 将 它 的 值 进行 调整 以 适应 寄存 器 的 
大 小 。 这 是 通过 ldb 和 ldh 指令 将 8 位 或 16 位 的 值 符号 扩展 为 32 位 来 完成 的 。 在 ldbu 和 ldhu 
指令 中 ， 操 作 数 是 用 零 扩 展 的 ， 因 为 其 值 表示 一 个 正 整数 。 
相对 应 的 Store 指令 有 : 
e@ stb ( Store Byte, 存储 字 节 )， 将 源 寄存 器 的 低位 字 节 存 储 到 有 效 地 址 所 指定 的 存储 器 字 
节 中 。 
e sth ( Store Half Word, 存储 半 字 )， 将 源 寄 存 器 的 低位 半 字 存储 到 有 效 地 址 ( 必须 是 半 字 
对 齐 的 ) 所 指定 的 存储 器 半 字 中 。 
每 一 条 Load 或 Store 指令 还 有 可 以 访问 IO 接口 中 的 单元 的 版 本 。 这 些 指令 是 : 
e ldwio ( Load Word IO ， 加 载 IO 接口 中 的 字 ) 
e ldbio ( Load Byte IO ， 加 载 IO 接口 中 的 字 节 ) 
e@ ldbuio ( Load Byte Unsigned IO ， 加 载 IO 接口 中 的 无 符号 字 节 ) 
e ldhio ( Load Halfword IO， 加 载 IO 接口 中 的 半 字 ) 
e ldhuio ( Load Halfword Unsigned MO， 加 载 IO 接口 中 的 无 符号 半 字 ) 
e@ stwio ( StoreWord IO， 向 VO 接口 存储 字 ) 
e@ stbio ( Store Byte IO， 向 VO 接口 存储 字 节 ) 
e@ sthio( Store Halfword IO， 向 IO 接口 存储 半 字 ) 
当 Nios II 处理 器 和 一 个 高 速 缓存 (第 8 章 中 讨论 的 概念 ) 一 起 使 用 时 ， 便 需要 用 到 Load 
和 Store 指令 的 VO 版 本 。 高 速 缓存 是 一 个 相对 较 小 但 访问 速度 比 主 存储 器 快 的 存储 器 。 通 常 
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将 主 存储 器 中 最 近 使 用 的 指令 和 数据 装 人 高 速 缓存 中 ， 这 样 ， 当 再 次 需要 它们 的 时 候 便 可 以 
更 快速 地 访问 它们 。 这 对 于 通常 可 以 在 主 存储 器 中 找到 的 指令 和 数据 来 说 是 非常 有 利 的 。 但 
是 ， 如 果 一 个 用 来 访问 特定 数据 的 地 址 指向 的 是 一 个 存储 器 映射 IO 接口 时 ， 这 种 方法 是 不 合 
适 的 ， 因 为 IO 接口 中 的 输入 数据 可 随时 变化 ， 并 且 通 常 必须 将 输出 数据 直接 发 送 给 IO 设备 。 
Load 和 Store 指令 的 IO 版 本 绕 过 高 速 缓存 〈 如 果 有 高 速 缓存 的 话 )， 始 终 访 问 IO 单元 。 


B.4.3 算术 指令 

算术 指令 是 对 通用 寄存 器 中 的 数据 或 者 指令 中 的 立即 值 数据 进行 操作 的 ， 包 括 以 下 指令 : 
add ( Add Registers ， 寄 存 器 加 ) 
addi ( Add Immediate， 立 即 数 加 ) 
sub ( Subtract Registers ， 寄 存 器 减 ) 
subi ( Subtract Immediate， 立 即 数 减 ) 
mul ( Multiply， 乘 ) 
muli ( Multiply Immediate， 立 即 数 乘 ) 
div (Divide， 除 ) 
divu (Divide Unsigned， 无 符号 除 ) 
Add 指令 


add IT vr,rk 
将 寄存 器 Z 和 区 中 的 内 容 相 加 ， 并 将 和 放 到 寄存 器 立 中 。 
Add Immediate 指令 
addi ri,1/, 85 
将 寄存 器 7 中 的 内 容 与 立即 值 85 相 加 ， 并 将 其 结果 放 到 寄存 器 ri 中 。 指 令 中 的 立即 操作 数 用 
16 位 表示 ， 在 加 法 运算 之 前 将 其 符号 扩展 为 32 位 。 
Subtract 指令 
sub ri,1w,rk 
将 寄存 器 所 中 的 内 容 减 去 寄存 器 rk 中 的 内 容 ， 并 将 结果 放 到 寄存 絮 ri 中 。 
Multiply 指令 
mul ri,r,rk 
将 寄存 器 7 和 区 中 的 内 容 相 乘 ， 并 将 乘积 的 低 32 位 放 到 寄存 器 ri 中 。 乘 法 运算 将 操作 数 作为 
无 符号 数 处 理 。 不 管 操作 数 是 无 符号 还 是 有 符号 的 ， 如 果 所 生成 的 乘积 可 以 用 32 位 表示 ， 那 
么 寄存 器 ri 中 的 结果 就 是 正确 的 。Maultiply 指令 的 立即 数 版 本 为 
muli ri,r, Valuel6 
其 中 的 16 位 立即 操作 数 Value16 被 符号 扩展 为 32 位 。 
Divide 指令 
div ri,v,rk 
将 寄存 器 7 中 的 内 容 除 以 寄存 器 性 中 的 内 容 ， 并 把 商 的 整数 部 分 放 到 寄存 器 立 中 。 将 操作 数 
视 为 有 符号 整数 。divu 指令 以 同样 的 方式 执行 ， 但 其 操作 数 视 为 无 符号 整数 。 


B.4.4 ”逻辑 指令 


逻辑 指令 提供 AND (与 ) OR (或 )、XOR ( 异 或 ) 和 NOR (或 非 ) 运算 。 它 们 对 通用 
寄存 器 中 的 数据 或 者 指令 中 的 立即 值 数据 进行 运算 。 
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AND 指令 
and Tri,r,rk 

对 寄存 器 和 次 中 的 内 容 进 行 按 位 逻辑 与 运算 ， 并 将 结果 保存 在 寄存 器 立 中 。 同 样 ， 指 令 or、 
xor 和 nor 分 别 执行 或 、 异 或 和 或 非 运算 。 

AND Immediate 指令 

andi ri,1, Valuel6 

对 寄存 器 了 中 的 内 容 和 16 位 立即 操作 数 Value16 ( 用 零 扩展 到 32 位 ) 执行 按 位 逻辑 与 运算 ， 
并 将 结果 保存 到 寄存 器 ri 中 。 同 样 ， 指 令 ori、xori 和 nori 使 用 立即 操作 数 来 分 别 执行 或 、 异 
或 和 或 非 运 算 。 

还 可 以 将 16 位 的 立即 操作 数 用 作 修 辑 运 算 中 的 高 16 位 ， 在 这 种 情况 下 操作 数 的 低 16 位 
是 零 ， 可 通过 如 下 指令 来 实现 : 

e andhi (AND High Immediate， 立 即 数 高 位 与 ) 

e orhi ( OR High Immediate， 立 即 数 高 位 或 ) 

e xorhi ( XOR High Immediate， 立 即 数 高 位 异 或 ) 
这 提供 了 一 种 将 32 位 的 立即 值 装 和 寄存 器 中 的 机 制 : 首先 使 用 orhi 指令 将 高 16 位 放 到 寄存 器 
中 ， 然 后 使 用 ori 指令 在 低 16 位 进行 或 操作 。 


B.4.5 “Move 指令 


Move( 传送 ) 指令 将 一 个 寄存 器 的 内 容 复制 到 另 一 个 寄存 器 中 ， 或 者 将 一 个 立即 值 放 到 
一 个 寄存 器 中 。 这 类 指令 是 伪 指 令 ( pseudoinstruction )， 为 程序 员 提 供 方便 ， 而 汇编 程序 使 用 
其 他 指令 来 实现 伪 指令 。 指 令 
mov TI 
将 寄存 器 7 中 的 内 容 复制 到 寄存 器 ri 中 。 该 指令 可 以 实现 为 
add Ti,1,rO 
Move Immediate ( 传送 立即 数 ) 指令 
movi Tri, Value16 
将 16 位 立即 数 Value16 符号 扩展 为 32 位 ， 并 将 它 装 入 寄存 器 ri 中 。 该 指令 可 以 实现 为 
addi Tri,r0, Valuel6 
Move Unsigned Immediate ( 传送 无 符号 立即 数 ) 指令 
movui Tri, Valuel6 
将 16 位 立即 数 Value16 用 零 扩 展 为 32 位 ， 并 将 它 装 入 寄存 器 ri 中 。 该 指令 可 以 实现 为 
ori i,r0, Valuel6 
Move Immediate Address (传送 立即 数 地 址 ) 指令 
movie ri, LABEL 
将 地 址 LABEL 所 对 应 的 32 位 值 装 和 人 寄存 器 ri 中 。 汇 编程 序 可 通过 下 面 两 条 指令 来 实现 该 
指令 : 
orhi i,r0, LABEL HIGH 
or fri,Tri, LABEL LOW 
其 中 LABEL_HIGH 和 LABEL LOW 是 LABEL 的 高 16 位 和 低 16 位 。 
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B.4.6 Branch 与 Jump 指令 

使 用 Branch ( 转移 ) 或 Jump ( 跳 转 ) 指令 可 以 改变 程序 的 执行 流程 。Unconditional 
Branch ( 无 条 件 转移 ) 指令 

br LABEL 

无 条 件 地 转 去 执行 地 址 LABEL 处 的 指令 。 转 移 目标 以 在 指令 中 包含 一 个 16 位 的 有 符号 偏 移 
量 的 形式 来 指定 。 偏 移 量 是 紧 跟 在 br 之 后 的 那 条 指令 到 地 址 LABEL 之 间 的 距离 ( 以 字 节 为 
单位 )。 

使 用 Conditional Branch ( 条 件 转移 ) 指令 可 实现 程序 执行 的 条 件 转移 ， 这 些 指令 比较 两 
个 通用 寄存 器 中 的 内 容 ， 如 果 结 果 满 足 转移 条 件 ， 则 产生 一 个 转移 。 例 如 ，Branch if Less Than 
Signed ( 如 果 小 于 有 符号 数 则 转移 ) 指令 

blt ri, rj, LABEL 

执行 比较 操作 [ri] < [中 ， 它 将 寄存 器 中 的 内 容 视 为 有 符号 数 。 

Branch if Less Than Unsigned ( 如 果 小 于 无 符号 数 则 转移 ) 指令 

bltu ri,v, LABEL 

执行 比较 操作 [ri] < [vj]， 它 将 寄存 器 中 的 内 容 视 为 无 符号 数 。 

同样 形式 的 其 他 条 件 转移 指令 还 有 : 

® beq (Comparison [ri] =[t]， 比 较 [ri] = [中 ) 

® bne (Comparison [ri] < [中 ， 比 较 [ri] z [gj]) 

e@ bge ( Signed comparison [ri] 三 [中 ]， 有 符号 比较 [ri] 二 [zj]) 
bgeu ( Unsigned comparison [ri] 之 [中 ， 无 符号 比较 [ri] [gy]) 
bgt ( Signed comparison [ri] > [中 ， 有 符号 比较 [ri] > [yD] ) 
bgtu ( Unsigned comparison [ri] > [中 ， 无 符号 比较 [ri] > [yw] ) 
ble ( Signed comparison [ri] 三 [中 ， 有 符号 比较 [ri] < [四]) 

® bleu ( Unsigned comparison [ri] < [中 ， 无 符号 比较 [ri] < [gj] ) 
任何 转移 指令 的 目标 必须 是 在 一 个 16 位 的 偏 移 量 可 以 指定 的 范围 之 内 。 对 于 此 范围 之 外 的 目 
标 ， 需要 使 用 Jump 指令 


Jmp ri 

它 无 条 件 地 转移 到 指定 的 寄存 器 ri 中 所 包含 的 地 址 处 执行 。 

为 了 说 明 Nios II 指令 的 使 用 ,我们 考虑 一 下 图 2-8 中 将 一 个 列表 中 的 数字 相 加 的 程序 。 
图 B-1 给 出 了 这 个 程序 的 Nios 版本， 这 两 个 程序 使 用 了 相同 的 寄存 器 。 使 用 绝对 寻 址 方式 
将 列表 的 大 小 从 存储 单元 N 装 入 寄存 器 r2 中 。 假 设 地 址 N 可 以 用 16 位 表示 ， 这 是 因为 绝对 
寻 址 方式 实际 上 是 由 位 移 方式 实现 的 ， 而 位 移 方式 是 使 用 一 个 16 位 的 偏 移 量 加 上 r0 的 内 容 来 
确定 操作 数 的 有 效 地 址 的 。 使 用 Add 指令 将 寄存 器 r0 中 的 0 与 寄存 器 r3 中 的 内 容 相 加 来 将 
寄存 器 r3 清 零 。 将 地 址 NUMI1 指定 为 Add Immediate 指令 中 的 一 个 立即 操作 数 来 将 其 装 入 r4 
中 。 我 们 观察 到 ， 当 需要 指定 一 个 立即 操作 数 时 ， 我 们 可 以 通过 简单 地 给 出 它 的 名 称 ( 将 由 汇 
编程 序 识别 ) 或 实际 值 来 实现 。 操 作 码 add 指明 它 是 一 个 立即 操作 数 。 如 果 寄 存 器 r2 的 内 容 
大 于 零 ， 那 么 条 件 转移 指令 将 使 得 程序 在 LOOP 处 继续 执行 。 最 后 ， 请 注意 标签 LOOP 后 面 
必须 跟 有 一 个 冒号 ,注释 是 由 “/*” 和 “*/” 字 符 来 界定 的 。 
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加 载 列表 的 大 小 */ 

将 和 初始 化 为 0*/ 

加 载 第 一 个 数 的 地 址 */ 
获取 下 一 个 数 */ 

把 这 个 数 加 到 和 中 */ 


递增 指向 列表 的 指针 */ 
递减 计数 器 */ 

te *#/ 
保存 最 #/ 


B-1 图 2-8 中 程序 的 Nios II 实现 


全 | B.2 


在 图 B-1 的 程序 中 ,标签 N、NUMI1 和 SUM 所 对 应 的 地 址 必须 足够 小 以 使 其 可 以 用 16 
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位 来 表示 。 如 果 不 是 这 样 的 话 ， 那 么 程序 可 以 像 图 B-2 所 示 的 那样 进行 改进 。 这 里 ，movia 指 
令 用 来 将 32 位 的 地 址 装 入 寄存 器 中 ，moyv 指令 用 来 将 r3 清 零 。 





/* 获取 地 址 N*/ 

a en ee *] 

/* 将 和 化 为 0*/ 

* 加 肛 名 a *) 
/* 获取 下 一 个 数 */ 

/# 把 这 个 数 加 到 和 中 */ 
/* 递增 指向 列表 的 指针 */ 
/* 递减 计数 器 */ 

/#* 如 果 没 完成 就 循环 回 到 前 面 */ 
/* 获取 地 址 SUM*/ 

慷 保存 最 终 的 和 */ 


图 B-2 图 2-8 中 程序 的 一 种 更 普遍 的 Nios II 实现 


加 到 


图 2-11 中 的 程序 将 学 生 在 不 同 测验 中 所 取得 的 分 数 相 加 ， 网 B-3 给 出 了 该 程序 的 一 种 实现 


r2, LIST 


/* 获取 地 址 LISTY/ 

* 将 [3 清 零 */ 

/* 将 r4 清 零 */ 

/#* 将 rs 清 零 */ 

/# 获取 地 址 N*/ 

/# 加 载 n 值 */ 

/#* 将 下 一 个 学 生 的 测验 1*/ 
睛 成 绩 加 到 部 分 和 中 */ 
上 * 将 这 个 学 生 的 测验 2*/ 
作成 绩 加 到 部 分 和 中 */ 
民 将 这 个 学 生 的 测验 3*/ 
沁 成 绩 加 到 部 分 和 中 %W/ 
/* 递增 指针 */ 


/# 递减 计数 器 */ 

/# 如 果 没 完成 就 跳 回 到 前 面 */ 
证 将 测验 1 的 总 和 */ 

举 保 存 到 单元 SUM1 中 */ 

/# 将 测验 2 的 总 和 */ 

久 保存 到 单元 SUM2 中 */ 

儿 将 测验 3 的 总 和 */ 

入 保存 到 单元 SUM3 中 */ 





图 B-3 图 2-11 中 程序 的 实现 
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B.4.7 子 程 序 链 接 指令 


Nios II 有 两 条 调用 子 程序 的 指令 。Call Subroutine( 子 程序 调用 ) 指令 
call LABEL 
包括 一 个 26 位 的 无 符号 立即 数 。 该 指令 将 返回 地 址 (下 一 条 指令 的 地 址 ) 保存 在 寄存 器 r31 
中 。 然 后 ， 它 把 控制 权 转 交 给 地 址 LABEL 处 的 指令 。 该 跳 转 地 址 是 通过 将 程序 计数 器 的 高 4 
位 与 立即 值 Value26 和 两 个 低位 的 0 连接 起 来 确定 的 ， 如 下 : 
Jump address = PC31.28 : Value26 : 00 

因为 Nios II 指令 必须 是 字 对 齐 的 ， 所 以 两 位 最 低 有 效 位 是 0。 

Call Subroutine in Register ( 通过 寄存 器 调用 子 程序 ) 指令 

callr ri 

将 返回 地 址 保存 在 寄存 器 r31 中 ， 然 后 将 控制 权 转交 给 其 地 址 包含 在 寄存 避 ri 中 的 指令 。 

从 子 程序 返回 是 通过 如 下 指令 

ret 

完成 的 。 该 指令 将 使 得 程序 转移 到 寄存 器 r31 所 包含 的 地 址 处 执行 。 

图 B-4 说 明了 如 何 将 图 B-2 中 的 程序 写成 一 个 子 程序 的 形式 ， 其 中 的 参数 是 通过 处 理 器 
寄存 器 传递 的 。 


r2,N /* 获取 地 址 N*/ 

T2, (IT2) /* 加 载 列表 的 大 小 */ 

r4, NUMI /* 加 载 第 一 个 数 的 地 址 */ 
LISTADD /* 调用 子 程序 */ 

r6, SUM /* 获取 地 址 SUM*/ 

r3, (r6) /* 保存 最 终 的 和 */ 


r3,r0 /#* 将 和 初始 化 为 0*/ 

r5, (r4) /#* 获取 下 一 个 数 */ 

r3, r3, r5 /# 把 这 个 数 加 到 和 中 */ 

r4, r4, 4 /*# 递增 指向 列表 的 指针 */ 

r2, r2, 1 /* 递减 计数 器 */ 

I2, rT0, LOOP  /* 如 果 没 完成 就 循环 回 到 前 面 */ 
作 返回 到 调用 程序 */ 





图 B-4 将 图 B-2 中 的 程序 写成 一 个 子 程序 ; 参数 通过 寄存 器 传递 


图 B-5 显示 了 如 何 将 图 B-2 中 的 程序 写成 一 个 子 程序 ， 其 中 参数 是 通过 处 理 器 堆栈 来 传 
递 的 。 
例 B.6 

当 Subroutine Call ( 子 程序 调用 ) 指令 执行 时 ，Nios I 处理 器 将 返回 地 址 保存 在 寄存 器 
r31 (ra ) 中 。 在 藤 套 子 程序 中 ， 该 返回 地 址 必须 在 调用 第 二 个 子 程序 之 前 保存 在 处 理 器 堆栈 
中 。 图 B-6 显示 了 如 何 实现 典 套 子 程序 ， 它 对 应 于 图 2-21 中 的 程序 。 


r2, NUMI1 
sp, Sp, 4 
12, (sp) 
r2,N 

r2, (r2) 
sp, sp, 4 
r2, (sp) 
LISTADD 
r2, 4(sp) 
r3, SUM 
r2, (r3) 
sp, sp, 8 


LISTADD: sp, sp, 16 
r2, 12(sp) 
r3, 8(sp) 
r4, 4(sp) 
r5, (sp) 
r2, 16(sp) 
r4, 20(sp) 
I3, r0 
I5, (r4) 
IT3, r3, r5 
r4, r4, 4 
I2, r2, 1 
r2, r0, LOOP 
r3, 20(sp) 
r5, (sp) 
r4, 4(sp) 
r3, 8(sp) 
r2, 12(sp) 
sp, sp, 16 
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将 参数 压 人 栈 中 */ 


/* 调用 子 程序 */ 
人 * 从 栈 中 获取 结果 ，*/ 
/* 并 将 其 保存 到 单元 SUM 中 */ 


/* 恢复 栈 顶 */ 


保存 寄存 器 */ 


/* 将 计数 器 初始 化 为 n*/ 

/# 初始 化 指向 列表 的 指针 */ 

人 # 将 和 初始 化 为 0*/ 

/* 获取 下 一 个 数 */ 

作 把 这 个 数 加 到 和 中 */ 

/# 将 指针 增加 4*/ 

/# 递减 计数 器 */ 

/# 如 果 没 完成 就 循环 回 到 前 面 */ 
/# 将 结果 压 人 栈 中 所 

人/# 恢复 寄存 器 */ 


人 #* 返回 到 调用 程序 */ 


图 B-5 将 图 B-2 中 的 程序 写成 一 个 子 程序 ;参数 通过 堆栈 传递 


r2, PARAM2 /* 
,12) 

sp, sp, 4 

r2, (sp) 

I2, PARAMI1 
r2, (I2) 

sp, sp, 4 

r2, (sp) 
SUB1 

12, (Sp) 

r3, RESULT 
r2, (T3) 

sp, sp, 8 


sp, sp, 24 
ra, 20(sp) 
fp, 16(sp) 
r2, 12(sp) 
r3, 8(sp) 
r4, 4(sp) 
rS, (sp) 





图 B-6， 册 套 子 程序 ;图 2-12 中 程序 的 实现 


将 参数 放置 到 栈 中 %/ 


调用 子 程序 */ 

从 栈 中 获取 结果 ，*/ 

并 将 其 保存 到 单元 RESULT 中 */ 
恢复 栈 顶 */ 


保存 寄存 器 */ 
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fp, sp, 16 初始 化 结构 指针 */ 
r2, 8(fp) 获取 第 一 个 参数 */ 
r3, 12(fp) 获取 第 二 个 参数 */ 
r5, PARAM3 获取 必须 传递 给 */ 
r4, (r5) SUB2 的 参数 ，*/ 
sp, sp, 4 并 将 其 压 入 栈 中 */ 
r4, (sp) 
SUB2 
r4, (sp) 从 SUB2 获取 结果 */ 
sp, Sp, 4 
r5, 8(fp) 将 答案 放 入 栈 中 */ 
r5, (sp) 恢复 寄存 器 */ 
r4, 4(sp) 
r3, 8(sp) 
r2, 12(sp) 
fp, 16(sp) 
ra, 20(sp) 
sp, sp, 24 

544 返回 到 主 程序 */ 





sp, sp, 12 保存 寄存 器 */ 

fp, 8(sp) 

r2, 4(sp) 

r3, (sp) 

fp, sp, 8 初始 化 结构 指针 */ 
r2, 4(fp) 获取 参数 */ 


r3, 4(fp) 将 SUB2 的 结果 放 和 人 栈 中 */ 
r3, (sp) 恢复 寄存 器 */ 

I2, 4(sp) 

fp, 8(sp) 

sp, sp, 12 


返回 到 SUB1*/ 





B.4.8 ”Comparison 指令 


Comparison ( 比较 ) 指令 比较 两 个 寄存 器 的 内 容 或 者 将 一 个 寄存 器 的 内 容 和 一 个 立即 值 进 
行 比较 ， 并 将 1 (如 果 为 真 ) 或 0 (如 果 为 假 ) 写 人 结果 寄存 器 。 
Compare Less Than Signed ( 有 符号 数 的 小 于 比较 ) 指令 
cmplt ri,vw,rk 
将 寄存 器 和 区 中 的 有 符号 数 进行 [中 < [rk] 的 比较 操作 ， 如 果 结 果 为 真 ， 就 将 1 写 入 寄存 器 
ri 中， 否则 ， 就 写 入 0。 
Compare Less Than Unsigned ( 无 符号 数 的 小 于 比较 ) 指令 
cmpltu ri, vw,rk 
与 cmplt 指令 执行 相同 的 功能 ， 但 它 将 操作 数 视 为 无 符号 数 。 
这 种 类 型 的 其 他 指令 还 有 : 
e cmpeq ( Comparison [中 ] = [rt ， 比 较 [wj] = [r] ) 
e cmpne ( Comparison [D] 和 [rz 中， 比较 [器 [rk] ) 
[545 | e cmpge ( Signed comparison [zj] 三 [rz ， 有 符号 比较 [vj] 大 [rk] ) 
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cmpgeu ( Unsigned comparison [ID]  [r 加 ， 无 符号 比较 [wy] > [rk] ) 
cmpgt ( Signed comparison [tj] > [rf]， 有 符号 比较 [yj] > [rk] ) 
cmpgtu ( Unsigned comparison [D] > [rK]， 无 符号 比较 [中 > [rk] ) 
cmple ( Signed comparison [tj] 科 [rz 名， 有 符号 比较 [办 二 [x4]) 
cmpleu ( Unsigned comparison [D] 入 [rkK]， 无 符号 比较 [vj] 二 [rd ) 

Comparison 指令 的 立即 数 版 本 包括 一 个 16 位 的 立即 操作 数 。 例 如 ，Compare Less Than 
Signed Immediate ( 有 符号 立即 数 的 小 于 比较 ) 指令 

cmplti ri,r, Value16 

将 寄存 器 7 中 的 有 符号 数 与 符号 扩展 后 的 立即 操作 数 进行 比较 。 如 果 [gj] < Value16， 就 将 1 写 
人 寄存 器 ri 中 ， 否 则 写 入 0。 

Compare Less Than Unsigned Immediate ( 无 符号 立即 数 的 小 于 比较 ) 指令 

cmpltuil ri, 1, Value16 

将 寄存 器 5y 中 的 无 符号 数 与 零 扩 展 后 的 立即 操作 数 进行 比较 。 如 果 [yj] < Value16， 就 将 1 写 人 
寄存 器 ri 中 ， 否 则 写 入 0。 

这 种 类 型 的 其 他 指令 还 有 : 

e cmpeqi (Comparison [t/] = Value16， 比较 [wy] = Valuel16 ) 
cmpnei ( Comparison [7] 关 Value16; 比较 [wy] 关 Value16) 
cmpgei ( Signed comparison [tj] 宇 Value16， 有 符号 比较 [D] 宇 Value16 ) 
cmpgeui ( Unsigned comparison [rj] 三 Value16， 无 符号 比较 [tj] 宇 Value16 ) 
cmpgti ( Signed comparison [tj] > Value16， 有 符号 比较 [中 > Value16) 
cmpgtui ( Unsigned comparison [tj] > Value16， 无 符号 比较 [wy] > Value16 ) 
cmplei ( Signed comparison [tj] 三 Value16， 有 符号 比较 [ 二 Value16 ) 
cmpleui ( Unsigned comparison [zj] 三 Value16， 无 符号 比较 [wy] 二 Value16 ) 


B.4.9 Shift 指令 


Shift ( 移 位 ) 指令 将 一 个 指定 寄存 器 中 的 内 容 向 右 或 向 左 移 位 。 
Shift Right Logical ( 逻辑 右 移 ) 指令 : 
ST] ri,r,rk 

根据 寄存 器 tk 中 的 5 位 最 低 有 效 位 (表示 0 到 31 范围 内 的 数 ) 所 指定 的 位 数 ， 将 寄存 器 vj 中 
的 内 容 向 右 移动 ， 并 将 结果 保存 在 寄存 器 ri 中 。 被 移 位 的 操作 数 左边 空 出 的 位 用 零 填 充 。 

Shift Right Logical Immediate ( 逻辑 右 移 立 即 数 ) 指令 

Srll ri,r/, Value9 

根据 指令 中 给 出 的 5 位 无 符号 值 Values 所 指定 的 位 数 ， 将 寄存 器 5 的 内 容 向 右 移 位 ， 并 将 结 
果 保 存在 寄存 器 ri 中 。 被 移 位 的 操作 数 左边 空 出 的 位 用 零 填 充 。 

其 他 的 Shift 指令 还 有 : 

e@ sra ( Shift Right Arithmetic, 算术 右 移 ) 

e srai ( Shift Right Arithmetic Immediate， 算 术 右 移 立即 数 ) 

e sll ( Shift Left Logical， 逻 辑 左 移 ) 

e slli (Shift Left Logical Immediate， 逻 辑 左 移 立 即 数 ) 

sra 和 srai 指令 执行 的 操作 与 srl 和 srli 指令 相同 ， 除 了 将 符号 位 tj 复制 到 被 移 位 的 操作 
数 左 边 空 出 的 位 上 。 
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sl 和 slli 指令 与 st] 和 srli 指令 类 似 ,但 它们 是 将 寄存 器 可 中 的 操作 数 左 移 并 将 右边 空 出 
的 位 用 零 填充 。 


B.4.10 ”Rotate 指令 
有 三 条 Rotate ( 循环 移 位 ) 指令 。Rotate Right ( 循环 右 移 ) 指令 : 


TOT ri, ,rk 
根据 寄存 器 rk 中 的 5 位 最 低 有 效 位 (表示 0 到 31 范围 内 的 数 ) 所 指定 的 位 数 ， 将 寄存 器 7 中 
的 位 按照 从 左 到 右 的 方向 循环 移 位 ， 并 将 结果 保存 在 寄存 器 立 中 。 
Rotate Right ( 循环 左 移 ) 指令 
rol ri,r,rk 
与 ror 指令 类 似 ,但 它 将 操作 数 按照 从 右 到 左 的 方向 进行 循环 移 位 。 
Rotate Left Immediate ( 循环 左 移 立即 数 ) 指令 
roli ri T, Value5 
根据 指令 中 给 出 的 5 位 无 符号 值 Value5 所 指定 的 位 数 ， 将 寄存 器 了 中 的 位 按照 从 右 到 左 的 方 
向 循环 移 位 ， 并 将 结果 保存 在 寄存 器 ri 中 。 
在 图 2-24 中 ， 我们 给 出 了 一 个 程序 ， 它 将 两 个 BCD 数字 打包 成 一 个 字 节 。 该 程序 的 一 个 
Nios I 版 本 如 图 B-7 所 示 。 


r2, LOC /# [2 指向 数据 */ 

r3, (I2) /* 将 第 一 个 字 节 装 人 rr3 中 */ 
r3, r3, 4 /* 左 移 4 位 */ 

r2, r2, 1 /# 递增 指针 */ 

r4, (r2) /# 将 第 二 个 字 节 装 和 信 r4 中 */ 


r4,r4, 0xXF ”/* 将 高 位 清 为 0*/ 
r3,r3,74 /* 连接 BCD 数字 */ 

r2, PACKED /* 将 结果 保存 到 单元 */ 
r3, (r2) /# PACKED 中 #/ 





图 B-7 一 个 将 两 个 BCD 数字 打包 到 一 个 字 节 中 的 程序 ， 对 应 于 图 2-24 


B.4.11 ”Control 指令 


对 于 B.9 节 中 将 要 讨论 的 控制 寄存 器 ， 有 两 条 对 其 进行 读 和 写 的 特殊 指令 。Read Control 
Register ( 读 控 制 寄存 器 ) 指令 
rdctl ri, ct 
将 控制 寄存 器 cty 中 的 内 容 复 制 到 通用 寄存 器 ri 中 。 
Write Control Register ( 写 控制 寄存 器 ) 指令 : 
wretl ctb,ri 
将 通用 寄存 器 避 中 的 内 容 复制 到 控制 寄存 器 cty 中 。 
有 两 条 人 处理 异常 的 指令 : trap 和 eret。 它 们 与 call 和 ret 指令 类 似 ， 但 它们 用 于 异常 。 我 
们 将 在 B.10.2 节 中 讨论 它们 。 
还 有 管理 高 速 缓存 的 指令 : ftushd ( 刷新 数据 高 速 缓存 行 )、ftushi ( 刷新 指令 高 速 缓存 行 )、 
initd ( 初始 化 数据 高 速 缓存 行 ) 和 initi ( 初始 化 指令 高 速 缓存 行 )。 
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B.5 伪 指 令 
为 了 编程 方便 ， 具有 各 种 不 同 的 指令 是 很 有 用 的 。 从 硬件 的 角度 来 看 ， 很 多 指令 都 需要 
大 量 的 电路 来 实现 。 通 常情 况 下 ， 某 些 指令 的 操作 可 以 通过 其 他 指令 来 有 效 地 实现 。 如 果 这 些 
指令 不 通过 硬件 实现 ， 则 它们 被 称 为 伪 指 令 (pseudoinstruction )。 汇 编程 序 会 将 伪 指 令 蔡 换 为 
硬件 实现 的 实际 指令 。 548 
B.4.5 节 中 ， 我 们 看 到 ，Move 指令 为 伪 指 令 。 本 节 将 介绍 一 些 其 他 的 伪 指 令 。 
Subtract Immediate( 立即 数 减 法 ) 指令 
subi Ti, ri, Valuel6 
addi ri,1,—Valuel6 
Branch Greater Than Signed ( 大 于 有 符号 数 时 转移 ) 指令 
bgt ri,1, LABEL 
被 实现 为 blt 指令 ， 并 交换 寄存 器 操作 数 的 顺序 。 
当 编 写 一 个 程序 时 ， 程 序 员 不 需要 知道 某 指 令 是 否 是 伪 指令 。 但 是 ， 如 果 程 序 员 试图 在 
调试 过 程 中 检查 汇编 代码 ， 就 必须 知道 是 否 是 伪 指令 。 


B.6 汇编 指示 
Nios II 的 汇编 指示 ( assembler directive ) 符合 广泛 使 用 的 GNU 汇编 程序 所 定义 的 规范 ， 
GNU 汇编 程序 是 在 公共 领域 中 使 用 的 软件 。 汇 编 指示 符 以 一 个 句号 开始 。 下 面 介绍 一 些 常 用 
的 指示 符 。 
.Org Value 

这 是 在 第 二 章 中 讨论 的 ORIGIN 指示 符 。 

.equ LABEL, Value 
名 称 LABEL 与 Value 等 价 。 例 如 

.equ LIST, 0x1000 
将 十 六 进 制 数 1000 赋值 给 LIST。 

.byte expressions 
将 字 节 大 小 的 数据 项 放 到 存储 器 中 。 数 据 项 通过 用 逗号 分 隔 的 表达 式 来 指定 。 例 如 : 23，6 + 
LABEL 和 2Z-4。 每 个 表达 式 都 被 汇编 到 下 一 个 字 节 中 。 

.hword expressions 549 
这 与 .byte 一 样 ， 除 了 表达 式 被 汇编 成 连续 的 16 位 半 字 。 

.Word expressions 


这 与 .byte 一 样 ， 除 了 表达 式 被 汇编 成 连续 的 32 位 字 。 


.Skip Size 
这 是 在 第 2 章 中 讨论 的 RESERVE 指令 。 它 在 存储 器 中 保留 Size 所 指定 的 字 节 数 。 
.end 
指示 源 代码 文件 的 结尾 。 该 指示 符 之 后 的 一 切 代码 都 将 被 汇编 程序 忽略 。 


图 B-8 说 明了 一 些 汇编 指示 符 的 使 用 ， 它 对 应 于 图 2-13。 


550 
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.Org 100 将 该 代码 放 到 单元 100 中 */ 

movia r2,N 获取 地 址 N*/ 

ldw r2, (r2) 加 载 列表 的 大 小 */ 

mov  r3,m0 将 和 初始 化 为 0*/ 

movia r4, NUMI 加 载 第 一 个 数 的 地 址 */ 
获取 下 一 个 数 */ 
把 这 个 数 加 到 和 中 */ 
递增 指向 列表 的 指针 */ 
递减 计数 器 */ 
如 果 没 完成 就 循环 回 到 前 面 */ 

movia r6, SUM 获取 地 址 SUM*/ 

Stw r3, (r6) 保存 最 终 的 和 */ 

下 一 条 指令 


.Org 200 将 数据 放 到 单元 200 中 */ 
.Skip 4 

.word 150 

.Skip 600 

.end 





图 B-8 ”对 应 于 图 2-13 的 程序 


B.7 进位 和 溢出 检测 


当 执 行 诸如 Add 或 Subtract 这 样 的 算术 运算 时 ， 往 往 最 重要 的 是 要 了 解 最 高 有 效 位 是 否 
会 产生 进位 或 者 是 否 会 产生 算术 溢出 。 如 2.10.2 节 中 所 讨论 的 ， 一 个 使 用 条 件 码 的 处 理 器 会 自 
动 地 设置 C 和 V 标志 位 来 指示 是 否 有 发 生 进位 或 溢出 。 但 是 ，Nios II 处 理 器 不 包含 条 件 码 标 
志 。 对 于 有 符号 和 无 符号 操作 数 ，Add 和 Subtract 指令 都 以 同样 的 方式 执行 相应 的 操作 。 必 须 
使 用 附加 的 指令 来 检测 进位 和 溢出 的 产生 。 当 无 符号 数 相 加 或 相 减 时 ， 第 31 位 的 进位 输出 是 
非常 有 趣 的 。 当 运算 中 包含 有 符号 操作 数 时 溢出 也 是 非常 有 趣 的 。 

1. 加 法 中 的 进位 与 溢出 

当 执 行 如 下 指令 时 : 

add TIr4, r2, T3 
可 以 通过 检查 寄存 器 r4 中 的 无 符号 总 和 是 否 小 于 某 一 个 无 符号 操作 数 来 检测 是 否 发 生 进 位 。 
如 果 该 指令 后 面 有 如 下 指令 : 

cmpltu ITS, TI4, r2 
则 进位 位 将 会 被 写 人 到 寄存 器 r5 中 。 

当 检 测 到 一 个 进位 1 时 ， 如 果 想 转 到 位 置 CARRY 处 继续 执行 ， 则 可 以 通过 使 用 如 下 指令 
来 实现 : 

add r4,7r2,r3 
bltu r4,r2,CARRY . 

算术 溢出 可 以 通过 检查 源 操作 数 和 结果 的 符号 来 进行 检测 。 如 果 两 个 正 数 相 加 产生 一 个 
负数 和 或 者 两 个 负数 相 加 产生 一 个 正 数 和 ， 就 会 发 生 溢出 。 利 用 这 个 事实 ， 如 果 加 法 运算 产生 
算术 溢出 ， 那 么 指令 序列 

add r4, r2, T3 
xor ITS, r4, Tr2 
xor  r0, r4, T3 
and IT9, r$, r0 
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blt r5,r0,OVERFLOW . 
将 会 导致 一 个 到 OVERFLOW 的 跳 转 。 两 条 xor 指令 用 来 比较 总 和 与 每 一 个 被 加 数 的 符号 。 虽 
然 这 两 条 指令 对 所 有 32 位 数 都 执行 XOR 操作 ， 但 在 随后 的 转移 指令 中 只 考虑 符号 位 bj。 只 
有 当 和 与 加 数 的 符号 不 同时 ， 这 个 位 才 被 置 为 1。and 指令 使 得 只 有 当 两 个 操作 数 的 符号 相同 
但 总 和 的 符号 不 同时 ， 才 会 将 位 r53 置 为 1。 如果 rs 中 的 有 符号 数 为 负数 (r53 等 于 1 )，blt 
指令 将 导致 一 个 转移 。 
2. 减法 中 的 进位 和 溢出 
减法 运算 中 的 进位 和 溢出 条 件 可 以 使 用 类 似 的 方法 来 检测 。 所 生成 的 差 的 最 高 有 效 位 的 
进位 可 以 通过 检查 被 减 数 是 否 小 于 减 数 来 进行 检测 。 例 如 ， 如 果 在 减法 运算 中 产生 一 个 进位 ， 
那么 指令 
Sub TI4, r2, T3 
bltu 7r2, r3, CARRY 
将 使 得 程序 转移 到 位 置 CARRY 处 执行 。 
如 果 被 减 数 和 减 数 的 符号 不 同 并 且 所 生成 的 差 的 符号 与 被 减 数 的 符号 不 同 ， 那 么 就 会 发 
生 算术 溢出 。 这 种 情况 可 通过 下 列 指令 序列 进行 检测 : 
sub r4,72,73 
xor TIS, T2, T3 
xor Tr6,72,r4 
and r5,r5,r6 
blt r5,r0,OVERFLOW 
其 中 ， 两 条 xor 指令 分 别 将 被 减 数 的 符号 与 减 数 和 所 生成 的 差 的 符号 进行 比较 。 只 有 当 上 述 的 
溢出 条 件 为 真 时 ，and 指令 才 会 将 位 r531 置 为 1。 
考虑 一 个 将 两 个 整数 相 加 的 任务 ， 这 两 个 整数 太 大 ， 不 能 放 在 32 位 的 寄存 器 中 。 这 可 
以 通过 将 每 个 数 装 人 两 个 不 同 的 寄存 器 中 然后 执行 上 面 所 描述 的 进位 检测 加 法 来 完成 。 我 们 
将 使 用 十 六 进 制 数 ， 以 便于 查看 一 个 数 如 何在 两 个 寄存 器 中 表示 。 假 设 A=10A72C10F8，B 
=4A5C00FE04, 则 C=A+B 可 以 如 图 B-9 所 示 的 那样 进行 计算 。 寄 存 器 r2 和 r3 中 分 别 装 入 
A 的 低 32 位 和 高 32 位 ， 寄 存 器 r4 和 5 以 相同 的 方式 保存 B。 注 意 ， 寄 存 器 r2 和 r4 中 的 32 
位 值 是 通过 使 用 两 个 16 位 的 立即 操作 数 来 进行 装 入 的 ， 如 B.4.4 节 中 所 解释 的 那样 。A 和 B 
的 低 32 位 相 加 后 ， 进 位 输出 将 包含 在 高 32 位 的 加 法 中 。 所 生成 的 和 C = 5B032DOEFC， 则 放 
到 寄存 器 r6 和 7r7 中 。 
r2, r0, OxA72C 现在 r2 中 的 值 为 A72C0000 */ 
r2, r2, 0x10F8 现在 rz2 中 的 值 为 A72C10F8 */ 
r3, r0, Ox10 现在 r3 中 的 值 为 10 */ 
r4, r0, 0xSC00 现在 r4 中 的 值 为 5C000000 */ 


r4, r4, 0xFE04 现在 r4 中 的 值 为 SCOOFE04 */ 
r5, r0, 0x4A 现在 r5 中 的 值 为 4A */ 


r6, r2, r4 将 低 32 位 相 加 */ 

r7, r6, r2 检查 是 否 产 生 进 位 */ 
r7, 17, r3 将 进位 与 高 位 相 加 */ 
17,17, 15 将 进位 与 高 位 相 加 */ 





图 B-9 例 B.9 的 程序 


360 


B.8 示例 程序 


2.12 节 中 ， 我 们 给 出 了 两 个 示例 程序 。 计 算 两 个 向 量 点 积 程序 的 Nios I 版 本 由 图 B-10 给 
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出 ， 它 对 应 于 图 2-27。 搜 索 匹 配 字符 串 的 程序 如 图 B-11 所 示 ， 它 对 应 图 2-30。 


图 B-10 


movia 
movia 
movia 


ldw 


movia 


ldw 
sub 
add 
add 
mov 
mov 
ldb 
ldb 
bne 
addi 
addi 
bgt 


movia 


stw 
br 
addi 
bge 
movi 


NOMATCH: 


movia 


Stw 


r2, AVEC 

r3, BVEC 
r4,N 

r4, (r4) 
r5.r0 

r6, (r2) 

r7, (r3) 

r8, r6, 7 
IS515,18 

r2, 72,4 

r3, r3,4 

r4, r4, 1 

r4, r0, LOOP 
r2, DOTPROD 
TS, (r2) 


r2 指向 向 最 A */ 

r3 指向 向 量 B */ 
获取 地 址 N */ 

r4 作为 计数 器 */ 

r5 累加 点 积 */ 

获取 向 量 A 的 下 一 个 元 素 */ 
获取 向 量 B 的 下 一 个 元 素 */ 
计算 下 一 对 元 素 的 积 */ 
累加 到 前 面 的 和 中 */ 

增加 指向 向 量 A 的 指针 */ 
增加 指向 向 量 B 的 指针 */ 
递减 计数 器 */ 

如 果 没 有 完成 再 次 循环 */ 
将 点 积 保存 到 */ 
存储 器 中 */ 





计算 两 个 向 量 点 积 的 程序 ， 对 应 于 图 2-27 


2 

3:P 

r4,N 

r4, (r4) 

rS, M 

r5, (r5) 

r4, r4, r5 

r4, 72, r4 

1S; 13, 75 
r6,r2 

r7, T3 

r8, (r6) 

r9, (r7) 

r8, r9, NOMATCH 
r6, r6, 1 
了 

r5, r7, LOOP2 
r9, RESULT 
r2, (I9) 
DONE 
| 

r4, r2, LOOPI1 
Tr8, 一 1 

9, RESULT 
r8, (r9) 


next instruction 


图 B-11 


B.9 ”控制 寄存 器 


获取 7T(0) 的 地 址 */ 
获取 P(0) 的 地 址 */ 
获取 地 址 N */ 

读 取 值 n */ 
获取 地 址 M */ 

读 取 值 m */ 

计算 n 一 m*/ 

Tt 一 m) 的 地 址 */ 
Plm) 的 地 址 */ 
遍历 字符 串 T*/ 
沉 历 字符 串 P*/ 
比较 字符 串 T 和 */ 


P 中 的 一 对 字符 */ 


指向 了 中 的 下 一 个 字符 */ 
指向 P 中 的 下 一 个 字符 */ 
如 果 没 有 完成 再 次 循环 */ 
将 TD 的 地 址 保存 */ 
到 单元 RESULT 中 */ 


指向 了 中 的 下 一 个 字符 */ 
如 果 没 有 完成 循环 回 到 前 面 */ 
在 单元 RESULT 中 写 人 */ 
-1 表明 没有 发 现 匹 配 */ 





对 应 于 图 2-30 的 字符 串 搜索 程序 


到 目前 为 止 ， 我 们 只 考虑 了 通用 寄存 器 的 使 用 。 在 讨论 Nios II 的 输入 /输出 方法 之 前 ， 
我 们 需要 先 介绍 一 下 控制 寄存 器 。 在 第 3 章 中 ， 我 们 解释 了 控制 寄存 器 在 中 断 处 理 中 的 使 用 。 
图 3-7 描述 了 四 个 能 表示 该 任务 所 需 功 能 的 寄存 器 。Nios [1 控制 寄存 器 具有 相同 的 功能 。 在 
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Nios II 处 理 器 的 基本 配置 中 ， 有 六 个 控制 寄存 器 。 当 要 实现 诸如 存储 器 管理 单元 或 外 部 中 断 控 
制 器 等 高 级 的 硬件 模块 时 ， 还 需要 提供 额外 的 控制 寄存 器 。 


基本 的 控制 寄存 器 如 表 B-3 所 示 。 它 们 被 i 
称 为 cl0 到 ed5， 在 表 中 还 有 指示 它们 功能 的 
又 名 (alternate name )。 这 两 套 名 称 都 可 以 被 
汇编 程序 识别 。 控 制 寄存 器 可 通过 特殊 的 指令 
rdctl 和 wretl 进行 读 写 。 它 们 的 用 法 如 下 : 
。 寄 存 器 ctl0 是 状态 寄存 器 ， 它 表明 处 
理 器 当前 的 状态 。 在 基本 配置 中 ， 只 竺 处理 中 
使 用 其 中 的 两 位 : 处 理 器 标识 符 


田 PIE 是 处 理 器 中 断 允 许 位 。 当 PIE= 1 时 ， 处 理 器 将 接受 来 自 IO 设备 的 中 断 请 求 ， 
而 当 PIE= 0 时 ， 处 理 器 将 忽略 中 断 请求 。 

田 U 是 用 户 / 管 态 模式 位 。0 表示 管 态 模式 ，! 表示 用 户 模式 。 
当 正 在 执行 一 个 中 断 或 异常 服务 程序 时 ， 寄 存 器 ctll 用 于 自动 保存 状态 寄存 器 的 内 容 。 
EU 位 和 EPIE 位 分 别 保存 U 位 和 PIE 位 的 状态 。 
寄存 器 ctl2 用 来 保存 调试 中 断 ( debug break ) 过 程 中 状态 寄存 器 的 内 容 。BU 和 BPIE 
位 保存 U 和 PIE 位 的 状态 。 
寄存 器 ctl3 用 来 允许 来 自 IO 设备 的 个 别 中 断 。 其 中 每 一 位 对 应 于 irq0 到 irq31 中 的 一 
个 中 断 。 值 1 和 0 分 别 用 来 允许 和 禁止 每 个 中 断 。 
寄存 器 ctl4 表示 哪些 中 断 请 求 正 在 等 待 处 理 。 如 果 中 断 irqk 处 于 激活 状态 ,并且 中 断 
允许 位 ctl3k (等 于 1 ) 允许 该 中 断 ， 则 给 定位 ctl4 的 值 将 会 被 置 为 1。 
寄存 器 ctl5 用 来 保存 一 个 值 ， 该 值 能 唯一 标识 多 处 理 器 系统 中 的 一 个 处 理 器 。 

操作 模式 

Nios II 处 理 器 有 两 种 不 同 的 操作 模式 : 

e 管 态 模 式 (supervisor mode )， 在 这 种 模式 下 ， 处 理 器 可 以 执行 所 有 的 指令 ， 并 能 执行 

所 有 可 用 的 功能 。 当 处 理 器 复位 时 ， 进 入 此 模式 。 

e@ 用 户 模式 (user mode )， 在 这 种 模式 下 ， 一 些 控制 指令 不 能 执行 。 

在 Nios II 人 处理 器 的 基本 配置 中 ， 所 有 的 程序 都 在 管 态 模 式 下 运行 。 当 处 理 器 被 配置 为 包 
含 存储 器 管理 单元 时 ， 便 可 使 用 用 户 模式 了 。 用 户 模 式 的 唯一 目的 是 支持 操作 系统 ， 使 得 操作 
系统 软件 在 管 态 模式 下 运行 而 应 用 程序 在 用 户 模式 下 运行 。 


B.10 输入 /输出 


第 3 章 所 讨论 的 处 理 输 入 /输出 传输 的 一 般 概 念 完 全 适用 于 Nios [I 处理 器 。1/O 设备 采用 
存储 器 映射 IO 的 方式 ，L/O 传输 在 程序 的 控制 下 执行 或 者 通过 使 用 中 断 机 制 来 执行 。 


B.10.1 程序 控制 |/O 

3.1.2 节 介 绍 了 程序 控制 IO 的 概念 。 图 3-4 给 出 了 一 个 从 键盘 读 人 一 行 字符 并 将 其 发 送 给 
显示 设备 的 RISC 风格 的 程序 。 图 B-12 给 出 了 该 程序 的 Nios I 实现。 假定 键盘 和 显示 器 接口 
有 具有 图 3-3 所 示 的 寄存 器 。 这 些 寄存 器 的 名 称 与 图 3-3 所 示 的 地 址 相关 联 。 注 意 ， 可 通过 ldbio 
和 stbio 指令 来 访问 WO 寄存 器 。 正 如 B.4.2 节 所 介绍 的 ， 这 些 指令 可 以 绕 过 一 个 给 定 的 Nios II 
系统 中 的 高 速 缓存 。 
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KBD_DATA, 0x4000 /* 为 键盘 和 显示 器 的 数据 寄存 器 */ 
DISP_DATA, 0x4010 /* 指定 地 址 */ 
r2, LOC /# 存储 该 行 字符 的 单元 */ 
r3, KBD_DATA /* I3 指向 键盘 数据 寄存 器 */ 
r4, DISP_DATA /# r4 指向 显示 器 数据 寄存 器 */ 
/# 载 入 回 车 符 的 ASCII 码 */ 
人 + 读 取 键盘 状态 寄存 器 */ 
/# 检查 KIN 标志 */ 


/* 从 键盘 读 取 字符 */ 
/* 将 字符 写 人 主 存 ，#/ 
,2, 入 并 递增 指针 */ 
r6, 4(r4) /# 读 取 显示 器 状态 寄存 器 */ 
r6, r6, 4 /* 检查 DOUT 标志 */ 
r6, r0, ECHO 
17, (r4) /* 将 字符 发 送 给 显示 器 */ 
r5, 17, READ 人 * 如 果 字符 不 是 CR ( 回 车 )， 则 循环 回 到 前 面 */ 





图 B-12 一 个 读 取 并 显示 一 行 字 符 的 程序 ， 对 应 于 图 3-4 


B.10.2 ”中断 和 异常 


使 用 中 断 是 执行 VO 传输 的 一 种 有 效 方式 。3.2 节 概 括 描述 了 这 种 方法 。Nios II 实现 的 中 
断 符 合 这 一 描述 。 

Nios 了 I 系统 可 以 处 理 两 种 类 型 的 中 断 。 来 自 WO 设 备 的 服务 请 求 被 认为 是 硬件 中 断 
( hardware interrupt )。 其 他 任何 中 断 都 不 称 为 中 断 ， 而 称 为 异常 (exception )。 事 实 上 ， 通常 使 
用 术语 “异常 ”来 描述 任何 硬件 启动 或 软件 启动 的 偏离 正常 运行 的 情况 。 

程序 正常 执行 流程 中 的 异常 可 由 以 下 几 个 方面 引起 : 

e 硬件 中 断 

e 软件 陷阱 

e 未 实现 的 指令 

为 响应 异常 ，Nios II 处 理 器 执行 下 列 操作 : 

1 ) 将 status 寄存 器 〈ctl0 ) 中 的 内 容 复制 到 estatus 寄存 器 ( ctll ) 来 保存 现 有 的 处 理 器 状 
态 信息 。 

2 ) 清除 status 寄存 器 中 的 U 位 ， 以 确保 处 理 器 处 于 管 态 模式 。 

3 ) 清除 status 寄存 器 中 的 PIE 位 ， 以 禁止 更 多 的 外 部 中 断 。 

4) 将 返回 地 址 ( 异常 之 后 那 条 指令 的 地 址 ) 写 人 到 ea 寄存 器 (r29 ) 中 。 

5 ) 将 程序 的 执行 转移 到 异常 处 理 程序 ( exception handler )， 它 确定 了 异常 的 原因 ， 并 调 
用 所 需 的 异常 服务 程序 ( exception-service routine ) 来 响应 异常 。 

异常 处 理 程序 的 地 址 是 在 Nios II 系统 设计 的 时 候 指 定 的 ,不 能 在 运行 时 通过 软件 来 改变 。 
这 个 地 址 可 以 由 设计 者 提供 ; 否则， 默认 地 址 就 是 从 主 存 起 始 地 址 偏 移 0x20 的 位 置 。 例 如 ， 
如 果 主 存 地 址 从 0 开始 ， 那 么 异常 处 理 程序 的 默认 地 址 就 是 0x20。 

1. 硬件 中 断 

一 个 VO 设备 通过 发 出 处 理 器 32 个 中 断 请 求 输入 irq0 到 irq31 中 的 一 个 来 请 求 中 断 。 仅 
当 以 下 三 个 条 件 都 为 真 时 才 会 产生 中 断 : 

e status 寄存 器 中 的 PIE 位 被 置 为 1 

。 中 断 请 求 输入 irqk 是 有 效 的 

e 相应 的 中 断 允 许 位 ctl34 置 为 1 
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ipending 寄存 器 (ctl4 ) 中 的 内 容 表明 哪些 中 断 请 求 正 在 等 待 处 理 。 而 异常 处 理 程序 决定 哪个 
待 处 理 的 中 断 具 有 最 高 优先 级 ， 并 调用 相应 的 中 断 服务 程序 。 

中 断 服务 程序 完成 后 ， 使 用 eret ( 异常 返回 ) 指令 将 执行 控制 权 返 回 给 被 中 断 的 程序 。 当 
中 断 请 求 发 生 时 ，Nios II 处 理 器 不 会 先 完成 正在 执行 的 指令 ， 而 是 马上 开始 处 理 该 硬件 中 断 。 
(这 与 第 3 章 中 我 们 所 讨论 的 不 同 ， 那 一 章 中 我 们 假定 当前 指令 的 执行 被 完成 后 才能 响应 中 
断 。) 因此 ， 从 中 断 服务 程序 返回 后 ， 被 中 断 的 指令 必须 被 重新 执行 。 为 了 实现 这 一 目标 ， 蜡 
常 处 理 程 序 必须 调整 ea 寄存 器 的 内 容 ， 此 时 它 指 向 被 中 断 程 序 的 下 一 条 指令 。 因 此 ，ea 寄存 
器 中 的 地 址 必须 在 执行 eret 指令 之 前 减 去 4。 

图 B-13 显示 了 如 何 使 用 中 断 来 从 键盘 读 取 一 行 字符 并 使 用 轮 询 法 进行 显示 。 该 程序 对 应 
于 图 3-8 中 的 程序 。 为 了 使 例子 简单 ， 我 们 不 使 用 异常 处 理 程序 ， 而 只 使 用 必要 的 中 断 服 务 程 
序 。 假 设 键盘 是 异常 的 唯一 来 源 ， 因 此 当中 断 请 求 到 达 时 ， 程 序 自 动 将 其 视 为 来 自 键盘 。 

从 程序 中 可 以 观察 到 ， 我 们 将 地 址 KBD 和 DISPAY 分 别 定义 为 0x4000 和 0x4010， 这 是 
图 3-3 中 寄存 器 KBD DATA 和 DISP_DATA 的 实际 地 址 。 程 序 通过 位 移 寻 址 方式 访问 键盘 和 
显示 器 接口 中 的 其 他 寄存 器 。 通 过 使 用 伪 指 令 movia 来 将 32 位 的 地 址 KBD 和 了 DISPLAY， 以 
及 存储 单元 PNTR、EOL 和 LINE 的 地 址 装 人 处理 器 寄存 器 中 。 

还 需 注 意 的 是 ， 在 返回 到 被 中 断 的 程序 之 前 对 寄存 器 ea 中 的 异常 返回 地 址 进行 了 调整 。 


-equ KBD, 0x4000 /# 键盘 地 址 */ 

.equ DISPLAY, 0x4010 /* 显示 器 地 址 */ 

.equ PNTR, 0x2000 /* 存储 器 中 的 缓冲 区 指针 */ 
.equ EOL., 0x2004 /* 行 结束 指示 变量 */ 

.equ LINE,Ox2008 必 缓冲 区 起 始 地 址 */ 


中 断 服务 程序 
.Org Ox020 
ILOC: subi sp, sp, 16 /# 保存 寄存 器 */ 
stw r2, 12(sp) 
stw r3, 8(sp) 
stw r4, 4(sp) 
stw r5, (sp) 
movia r2,PNTR 
ldw r3, (r2) /#* 载 人 地 址 指针 */ 
movia r4, KBD 
ldbio 15, (r4) /* 从 键盘 读 人 字符 */ 
stb r5, (r3) /* 将 字符 写 人 存储 器 */ 
addi  r3,r3,1 /* 并 递增 指针 */ 
stw r3, (r2) /* 更 新 存储 器 中 的 指针 */ 
movia  I2, DISPLAY 
: ldbio  r3,4(r2) /#* 查看 显示 器 是 否 准备 就 绪 */ 
andi r3,r3,4 /#+ 检查 DOUT 标志 */ 
beq r3, r0. ECHO 
stbio rs, (r2) /#* 显示 刚 读 人 的 字符 */ 
addi ra,r0, 0x0D 让 回 车 符 的 ASCII 码 */ 
bne r5, r3, RTRN 人 # 如 果 字 符 不 是 CR， 则 返回 */ 
movi  r3,1 
movia  r$, EOL 
stw r3, (r5) /# 指示 行 的 结束 */ 
stbio r0, 8(r4) /# 在 KBD 接口 中 禁止 中 断 */ 
ldw r5, (sp) /# 恢复 寄存 器 */ 
ldw r4, 4(sp) 
ldw r3, 8(sp) 
ldw r2, 12(sp) 
addi sp, sp, 16 
subi ea, ea, 4 上 * 调整 返回 地 址 */ 
eret /* 从 异常 返回 */ 


图 B-13 使 用 中 断 方式 读 取 一 行 字符 ， 并 使 用 轮 询 方式 显示 该 行 字符 的 程序 
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: movia r2,LINE 
ia r3,PNTR 
3 初始 化 缓冲 区 指针 */ 
r2, EOL 
r0,. (r2) 清除 行 结 束 指示 变量 */ 
r2, KBD 


区 允许 键盘 中 断 */ 


r3, 8(r2) 

r2, ienable 

讼 ; 充 ,2 在 处 理 器 控制 寄存 器 中 */ 
ienable, r2 允许 键盘 中 断 */ 

r2. status 

r2,72, 1 

status, T2 * 设置 状态 寄存 器 中 的 PIE 位 */ 





2. 软件 陷阱 

当 在 程序 中 执行 trap 指令 时 ， 就 会 发 生 软 件 异常 。 这 将 使 得 下 一 条 指令 的 地 址 被 保存 在 
ea 寄存 器 ( r29 ) 中 。 然 后 ， 中 断 被 禁止 并 且 程 序 的 执行 被 转移 到 异常 处 理 程序 。 

异常 服务 程序 的 最 后 一 条 指令 是 eret， 它 将 执行 控制 权 返 回 到 导致 异常 的 trap 指令 之 后 的 
那 条 指令 。 返 回 地 址 是 寄存 器 ea 的 内 容 。eret 指令 通过 将 estatus 寄存 器 的 内 容 复 制 到 status 寄 
存 器 来 恢复 处 理 器 的 先前 状态 。 

软件 陷阱 的 一 个 常见 用 途 是 将 控制 权 转 移 给 一 个 不 同 的 程序 ， 比 如 操作 系统 ， 正 如 第 4 
章 所 解释 的 那样 。 

3. 未 实现 的 指令 

当 处 理 器 遇 到 一 条 硬件 没有 实现 的 有 效 指令 时 ， 就 会 发 生 异 常 。 例 如 ，Nios II 处 理 器 可 
能 被 配置 为 不 包含 执行 乘法 和 除法 运算 的 硬件 电路 。 在 这 种 情况 下 ， 如 果 遇 到 mul 或 div 指 
令 ， 将 会 发 生 异常 。 异 常 处 理 程序 可 能 调用 一 个 用 软件 实现 所 需 的 操作 。 

4. 异常 处 理 程 序 

异常 处 理 程序 是 一 个 处 理 异常 情况 的 程序 。 当 异常 发 生 时 ， oe tee 
中 的 一 个 预定 单元 ， 并 将 执行 控制 权 转 移 到 该 单元 。 如 上 所 述 ， 在 Nios II 系统 中 ， 异 常 
程序 的 默认 单元 是 0x20。 

图 B-14 给 出 了 异常 处 理 程序 的 框架 。 该 程序 从 保存 它 使 用 的 所 有 寄存 器 以 及 子 程序 链接 
寄存 器 ra 开始 ， 正 如 第 3 章 例 3.3 中 所 解释 的 那样 。 然 后 ， 它 必须 确定 异常 请 求 的 来 源 。 首 
先 ， 它 检查 该 请 求 是 否 是 一 个 硬件 中 断 。 它 读 取 ipending 控制 寄存 器 ， 逐 个 测试 这 个 字 的 每 一 
位 ， 以 找 出 被 置 为 1 的 位 。 这 些 位 被 检查 的 顺序 决定 了 各 种 中 断 源 被 赋予 的 优先 级 。 一 旦 找到 
被 置 为 1 的 位 ， 相 应 的 中 断 服务 程序 就 被 执行 。 虽然 可 能 有 多 达 32 种 不 同 的 中 断 源 ， 但 在 一 
个 典型 的 系统 中 ，LO 设备 的 数量 还 是 要 小 得 多 。 如 果 该 请 求 不 是 一 个 硬件 中 断 ， 那 么 就 检查 
其 他 的 异常 并 根据 需要 进行 处 理 。 在 返回 到 被 中 断 的 程序 之 前 ， 所 保存 的 寄存 器 被 恢复 。 

主 程序 必须 初始 化 所 需要 的 设置 ， 以 达到 1/O 设备 所 期 望 的 中 断 行为 。 这 类 似 于 图 B-13 
所 示 的 初始 化 操作 。 

5. 复位 

Nios II 系统 必须 包含 复位 (reset ) 功能 ， 使 其 有 可 能 从 一 个 不 能 作为 异常 进行 处 理 的 错 
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误 状 态 中 恢复 过 来 。 这 可 以 通过 提供 一 个 复位 键 来 完成 。 按 下 该 键 时 ， 处 理 器 复位 并 执行 一 个 
适当 的 程序 。 如 果 存 储 器 的 地 址 从 0 开始 ， 那 么 很 自然 地 将 会 使 用 这 个 地 址 作为 复位 位 置 ， 在 
实现 Nios II 系统 时 可 以 这 样 设置 。 当 处 理 器 复位 时 ,程序 计 数 器 和 控制 寄存 器 被 清 为 零 。 因 
此 ， 从 地 址 0 处 的 指令 开始 执行 。 为 了 能 在 复位 后 执行 主 程序 ， 只 需要 在 地 址 0 处 放置 一 条 
Branch 指令 ， 并 将 主 程序 的 第 一 条 指令 作为 转移 目标 。 1560| 


.org 0 
RESET: br START 转移 到 主 程序 */ 
异常 处 理 程 序 
.org “0x020 
ELOC: subi sp, sp, 12 保存 寄存 器 */ 
stw ra, 8(sp) 
et, 4(sp) 
r2, (sp) 


et, ipending 获取 待 处 理 的 中 断 请 求 */ 

et, r0, OTHER 不 是 外 部 中 断 */ 

ea, ea, 4 调整 返回 地 址 */ 

r2, et, 1 检查 irq0 是 否 处 于 激活 状态 */ 
r2, r0, IRQI 如 果 不 是 ， 则 检查 irq1*/ 

ISRO 处 理 irq0 请 求 */ 

r2, et, 2 检查 irql 是 否 处 于 激活 状态 */ 
r2, 10, IRQ2 如 果 不 是 ， 则 检查 irq2*/ 

ISR1 处 理 irql 请 求 */ 


r2, r0.0x8000 检查 第 31 位 的 模式 */ 
r2, et, r2 检查 irq31 是 否 处 于 激活 状态 */ 
DONE 如 果 不 是 ， 结 束 外 部 中 断 的 检查 */ 


ISR31 处 理 请 求 */ 


DONE 结束 外 部 中 断 的 检查 */ 
检查 其 他 异常 并 调用 所 需 的 
异常 服务 程序 的 指令 
ldw  r2, (sp) 族 恢复 寄存 器 */ 
ldw et,4(sp) 
ldw ra,%8(sp) 
addi sp, sp, 12 
eret 返回 到 被 中 断 的 程序 */ 
irq0 的 中 断 服务 程序 
ISRO: 


ret 
irq31 的 中 断 服务 程序 
ISR31: 
ret 
主 程序 
START: 





图 B-14 异常 处 理 程序 的 框架 [561] 


B.11 NIOS ll 处 理 器 的 高 级 配置 


在 前 面 的 音节 中 ， 我 们 讨论 了 Nios I 处 理 器 基本 配置 中 的 一 些 特点 。 我 们 还 可 以 实现 更 
大 的 Nios 下 处 理 器 ， 包括 可 以 提供 增强 功能 的 额外 硬件 模块 .在 本 节 中 ， 我 们 将 讨论 三 个 可 
能 的 增强 功能 . 
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B.11.1 外 部 中 断 控制 器 

B.10.2 节 描 述 了 内 部 中 断 控制 器 所 使 用 的 机 制 ， 其 中 软件 是 用 来 确定 中 断 请 求 的 优先 级 
的 。 这 种 方法 比较 简单 ， 易 于 实现 ， 但 在 一 些 应 用 中 对 中 断 进行 处 理 时 ， 它 可 能 会 导致 不 可 接 
受 的 较 长 延迟 。 为 了 减少 延迟 ， 处 理 器 可 以 包含 一 个 使 用 向 量 中 断 的 外 部 中 断 控 制 器 电路 。 在 
这 种 情况 下 ， 控 制 器 为 每 个 中 断 请 求 提 供 其 中 断 服 务 程 序 的 地 址 。 

为 了 进一步 减少 中 断 延 迟 ， 处 理 器 还 可 以 包含 32 个 通用 寄存 器 的 影子 寄存 器 。 可 以 实现 
几 组 影子 寄存 器 并 将 其 与 不 同 的 中 断 关 联 起 来 。 对 于 刚 接收 到 的 中 断 请 求 ， 外 部 中 断 控 制 器 确 
定 将 会 用 到 的 影子 寄存 器 组 。 然 后 ， 使 用 所 确定 的 影子 寄存 器 组 ， 而 不 使 用 一 般 的 寄存 器 组 。 
这 样 就 不 需要 保存 中 断 服 务 程序 所 使 用 的 寄存 器 内 容 。 

优先 级 与 不 同 的 中 断 相 关联 。 当 处 理 器 正在 处 理 一 个 给 定 优先 级 的 中 断 时 ， 它 只 能 被 另 
一 个 具有 更 高 优先 级 的 中 断 所 打 断 。 处 理 器 的 当前 优先 级 和 指示 活跃 影子 寄存 器 组 的 标识 是 
处 理 器 状态 的 一 部 分 。 处 理 器 的 状态 保存 在 状态 控制 寄存 器 ctl0 中 ， 而 上 述 这 些 信息 保存 在 
表 B-3 中 该 寄存 器 的 “保留 ”位 中 。 

在 定义 Nios I 处 理 器 时 ， 它 可 以 被 配置 为 使 用 内 部 中 断 控 制 器 或 者 使 用 外 部 中 断 控制 器 。 


B.11.2 存储 器 管理 单元 

Nios II 系统 可 以 包含 一 个 存储 器 管理 单元 (MMU )， 它 提供 了 8.8 节 所 讨论 的 功能 。 包 含 
MMU 的 目的 是 为 了 支持 使 用 存储 器 管理 能 力 的 操作 系统 ， 包 含 MMU 的 系统 可 以 使 用 管 态 模 
式 和 用 户 模 式 。MMU 是 一 个 可 选 的 单元 ， 在 设计 系统 的 时 候 可 以 指定 是 否 包含 MMU。 


B.11.3” 浮 点 硬件 

Nios I 体系 结构 提供 了 自 定义 指令 (custom instruction )。 这 些 指令 可 以 用 来 定义 各 种 操 
作 ， 但 这 些 操作 可 能 需要 使 用 额外 的 电路 。 有 一 组 预定 的 自 定 义 指令 可 以 用 来 实现 浮 点 算术 运 
算 。 如 果 需 要 进行 浮 点 运算 ， 就 需要 在 设计 Nios II 系统 的 时 候 包 含 必要 的 硬件 。 


B.12 ”结束语 


本 附录 中 ,我们 描述 了 Nios II 处 理 器 的 基本 实现 中 的 主要 特征 。 基 本 配置 可 提供 一 个 应 
用 广泛 、 功 能 强大 的 处 理 器 。 在 B.11 节 中 ， 我 们 介绍 了 可 包含 在 Nios 11 系统 中 的 用 来 提供 额 
外 功能 的 硬件 。 由 于 Nios II 是 一 个 软 处 理 右 ， 所 以 系统 设计 者 可 以 定制 系统 的 功能 ， 以 适应 
所 需 的 应 用 。 

Nios II 处 理 器 主要 用 于 商业 和 工业 应 用 中 ， 但 它 在 教学 环境 中 也 非常 具有 吸引 力 。 实 现 
Nios II 处 理 器 的 FPGA 技术 价格 合理 ， 易 于 使 用 。Altera 公司 日 前 已 经 开发 出 了 一 套 开发 教育 
板 ， 为 向 学 生 介 绍 数字 技术 提供 了 一 个 很 好 的 平台 。 这 些 开发 教育 板 中 包括 计算 机 系统 的 典型 
组 件 ， 可 使 学 生 很 容易 地 开展 关于 计算 机 组 织 的 硬件 和 软件 方面 的 研究 。 

在 Altera 公司 的 网 站 (http:/www.altera.com ) 上 可 以 找到 大 量 关 于 Nios I 处 理 器 和 系统 
的 文献 。 


B.13 ”问题 解析 


本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解决 这 样 的 问题 。 
例 B.10 
问题 : 假设 有 一 个 ASCII 编码 的 字符 串 保 存在 存储 器 中 ， 起 始 地 址 为 STRING。 该 字符 串 以 回 车 
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( CR ) 符 结束 。 写 一 个 Nios II 程序 来 确定 该 字符 串 的 长 度 。 
解答 : 图 B-15 给 出 了 一 个 可 能 的 程序 。 字 符 串 中 的 每 个 字符 与 CR ( ASCII 码 为 0x0D ) 进行 比较 ， 
计数 器 递增 ， 直 到 到 达 字 符 串 的 末尾 。 结 果 存 储 在 单元 LENGTH 中 。 


r2, STRING 
r3, r0, r0 
I4,r0. 0x0D 
r5, (r2) 

r5, r4, DONE 


12; 172; ] 
i37351 
LOOP 

r2, LENGTH 
r3, (r2) 


movia 
stw 


/+* 
/* 
/* 
/* 
/* 
/* 
J 
A 
/* 
/* 


r2 指向 字符 串 的 开始 */ 

r3 是 一 个 计数 嚣 ， 被 清 为 0 */ 

加 载 回 车 符 的 ASCII 码 */ 
获取 下 一 个 字符 */ 

如 果 是 回 车 符 ， 则 结束 */ 

递增 字符 串 指针 */ 

递增 计数 器 */ 

如 果 没 有 结束 ， 则 循环 回 到 前 面 */ 
将 计数 值 存放 到 */ 

存储 单元 LENGTH 中 */ 





图 B-15 例 B.10 的 程序 


例 B.11 


问题 : 我 们 希望 在 一 个 32 位 的 非 负 整数 列表 中 找 出 最 小 的 数 。 数 据 的 存储 地 址 从 (1000)1 开始 。 该 
地 址 处 的 字 必 须 保存 所 找到 的 最 小 数 ， 下 一 个 字 包 含 列表 中 的 项 数 n， 之 后 的 n 个 字 包 含 列表 中 的 数 。 


写 一 个 Nios II 程序 ， 找 出 最 小 的 数 ， 并 包含 按照 规定 组 织 数据 所 需 的 汇编 指示 ( assembler directive )。 
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解答 : 图 B-16 中 的 程序 实现 了 所 需 的 任务 。 程 序 中 的 注释 解释 了 这 个 任务 如 何 执行 。 列 表 中 包含 了 


一 些 样本 数字 。 


LIST, Ox1000 
r2, LIST 

r3, 4(r2) 

r4, r2. 8 

I3, (r4) 

r3, r3, 1 

r3, r0, DONE 
T4, r4, 4 

r6, (r4) 

r5, r6, LOOP 
r5, r6, r0 
LOOP 

rS, (TI2) 


0x1000 

4 

7 
4,5,3,6,1,8,2 


图 B-16 例 B.11 的 程序 





列表 起 始 地 址 */ 

I2 指向 列表 的 开始 */ 

r3 是 计数 器 ,初始化 为 n */ 
r4 指向 第 一 个 数 */ 

r5 保存 目前 为 止 所 找到 的 最 小 的 数 */ 
递减 计数 器 */ 

如 果 r3 等 于 0， 则 结束 */ 
递增 列表 指针 */ 
获取 下 一 个 数 */ 

检查 是 否 可 以 找到 更 小 的 数 */ 
修改 所 找到 的 最 小 的 数 */ 


将 最 小 的 数 存 储 到 SMALL 中 */ 


所 找到 的 最 小 数 的 存储 空间 */ 
列表 中 的 项 数 */ 
列表 中 的 项 */ 


问题 : 写 一 个 Nios 1 程序， 将 一 个 位 十 进 制 整数 转换 成 二 进 制 数 。 如 果 数 字 是 通过 键盘 输入 的 ， 
那么 十 进 制 数 是 以 n 个 ASCII 编码 字符 的 形式 给 出 的 

解答 : 考虑 一 个 4 位 十 进 制 数 D = dddido。 该 数 的 值 为 ((d; x 10+ dy) x 10+d1) x 10+ do。 该 数 
的 这 种 表示 是 图 B-17 中 程序 所 使 用 转换 技术 的 基础 。 注 意 ， 每 个 ASCII 编码 字符 先 被 转换 成 一 个 二 进 制 


编码 的 十 进 制 (BCD ) 数字 ， 然 后 再 用 于 计算 。 


问题 : 考虑 一 个 数字 阵列 A(i, 站 其 中 i= 0 到 n-1， 是 行 索 引 , j =0 到 m-1， 是 列 索 引 。 该 阵列 按 


行 存储 在 计算 机 的 存储 器 中 ， 每 行 元 素 占 用 m 个 连续 的 字 单元 。 


写 一 个 Nios I[ 子 程序 ， 将 第 x 列 的 元 素 
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逐一 加 到 第 列 的 元 素 上 ， 和 元 素 ( sum element ) 放 在 第 列 上 。 索 引 值 x 和 ?通过 寄存 器 I 和 3 传递 
给 子 程序 。 参 数 n 和 m 通过 寄存 器 r4 和 5 传递 给 子 程序 ， 元 素 A(0,0) 的 地 址 通过 寄存 器 r6 进行 传递 。 


movia 
ldw 
movia 
ldw 
movia 
ldw 
movia 
ldw 
movia 
call 


r2,N 

r2, (7r2) 

r3, DECIMAL 
r4, r0, m0 

r5, (r3) 

r5, r5, OxOF 
r4, r4, r5 


r3,r3, 1 
12;T2;.1 

r2, r0, DONE 
r4, r4, 10 
LOOP 

r5, BINARY 
r4, (r5) 





/* r2 是 计数 器 ，*/ 

/* 初始 化 为 n*/ 

/# r3 指向 ASCII 数字 */ 

人 # _r4 用 来 保存 二 进 制 数 */ 
/* 获取 下 一 个 ASCII 数字 */ 
/#* 产生 BCD 数字 */ 

族 加 到 中 间 结 果 中 */ 

/* 递增 数字 指针 */ 

/* 递减 计数 器 */ 


/# 乘 以 10 */ 

/# 如 果 未 完成 ， 则 循环 回 到 前 面 */ 
/* 将 结果 存放 到 */ 

/# 存储 单元 BINARY 中 */ 


图 B-17 例 B.12 的 程序 


解答 : 图 B-18 给 出 了 一 个 可 能 的 程序 。 我 们 假定 值 x*、y、n 和 m 分 别 存 放 在 存储 单元 X、Y、N 和 
M 中 。 此 外 ， 阵 列 中 的 元 素 存储 在 从 单元 ARRAY 开始 的 连续 的 字 中 ，ARRAY 是 元 素 A(0,0) 的 地 址 。 
程序 中 的 注释 说 明了 每 条 指令 的 作用 。 


r2,X 

r2, (IT2) 
r3,Y 

r3, (r3) 
r4,N 

r4, (r4) 

rS, M 

r5, (r5) 

r6, ARRAY 
SUB 


下 一 条 指令 


subi 
stw 
slli 


sub 
slli 

sll 

add 
add 
ldw 
ldw 


stw 
add 


bgt 





加 载 值 x */ 
加 载 值 y */ 
加 载 值 n*/ 


加 载 值 m */ 
加 载 A(0,0) 的 地 址 */ 


保存 寄存 器 7 的 内 容 */ 
确定 一 列 中 连续 元 素 */ 
之 间 的 距离 (以 字 节 为 单位 )*/ 


产生 y-x 的 值 W/ 

产生 40 -2 的 值 */ 
产生 4x 的 值 */ 

r6 指向 A(0x) */ 

r7 指向 A(0wy) */ 

获取 第 x 列 中 的 下 一 个 数 */ 
获取 第 列 中 的 下 一 个 数 */ 
将 两 数 相 加 ，*/ 

并 保存 总 和 */ 
递增 第 zx 列 的 指针 */ 
递增 第 列 的 指针 */ 
递减 行 计数 器 */ 

如 果 未 完成 ， 则 循环 回去 */ 
恢复 寄存 器 r7 的 内 容 */ 


返回 到 调用 程序 */ 


图 B-18 例 B.13 的 程序 
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例 B.14 

问题 : 假设 存储 单元 BINARY 中 包含 一 个 32 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显 
示 设 备 上 将 这 些 位 显示 为 8 个 十 六 进 制 数字 。 写 一 个 Nios II 程序 完成 这 个 任务 。 

解答 : 首先 ， 我 们 需要 将 这 个 32 位 的 模式 转化 为 用 ASCII 编码 字符 表示 的 十 六 进 制 数字 。 转 换 ， 
过 程 可 以 通过 使 用 查 表 法 来 完成 . 必须 构造 一 个 包含 16 项 的 表 ， 以 便于 为 每 一 个 十 六 进 制 数字 提供 其 “1566 
ASCII 码 。 然 后 ， 对 于 BINARY 中 该 模式 的 每 一 个 4 位 的 段 ， 都 可 以 在 表 中 查找 到 其 相应 的 字符 ， 
并 将 这 些 字符 存储 在 从 单元 HEX 开始 的 8 个 连续 的 字 节 单元 中 。 最 后 ,将 这 8 个 字符 发 送 给 显示 器 。 
图 B-19 给 出 了 一 个 可 能 的 程序 。 





movia 12, BINARY 获取 二 进 制 数 的 地 址 */ 
ldw r2, (r2) 加 载 该 二 进 制 数 */ 
movi rr3,8 r3 是 数字 计数 器 ， 被 设置 为 8 */ 
movia r4, HEX r4 指向 十 六 进 制 数字 */ 
roli r2, r2, 4 将 高 位 数字 循环 */ 
移 位 到 低位 位 置 上 */ 
andi r5,r2,OxF 提取 下 一 个 数字 */ 
ldb r6, TABLE(rS) 获取 该 数字 的 ASCII 码 ，*/ 
stb r6, (r4) 并 将 其 存储 在 HEX 缓冲 区 中 */ 
subi r3, r3, 1 递减 数字 计数 器 */ 
addi rr4,r4,1 递增 指向 十 六 进 制 数字 的 指针 */ 
bgt r3, r0, LOOP 如 果 不 是 最 后 一 个 数字 ， 则 循环 回 到 前 面 */ 
DISPLAY: movi T3, 8 
movia r4, HEX 
movia 72, DISP_DATA 
DLOOP: ldbio  r5,4(r2) 通过 测试 DOUT 标志 来 检查 */ 
r5, r5,4 显示 器 是 否 准备 就 绪 */ 
rs, r0, DLOOP 
r6, (r4) 获取 下 一 个 ASCII 字符 */ 
r6, (r2) 并 将 其 发 送 给 显示 器 */ 
r3, r3, 1 递减 计数 器 */ 
r4, r4, 1 递增 字符 指针 */ 
r3, r0, DLOOP 循环 ， 直 到 所 有 的 字符 都 显示 完毕 */ 


ASCII 编码 数字 的 存储 空间 */ 
Ox30,0x31,0x32,0x33 所 x 
Ox34,0x35,0x36,0x37 /* ASCII 码 转换 表 */ 
_ Ox38,0x39,0x41,0x42 
Ox43,0x44,0x45,0x46 





图 B-19 例 B.14 的 程序 


习题 

[E] B.1 写 一 个 程序 ， 计 算 表达 式 SUM = 580 + 68 400 + 80 000。 

[E] B.2 写 一 个 程序 ， 计 算 表 达 式 ANSWER =AxB+CxD。 

[M] B.3 写 一 个 程序 ， 在 一 个 含有 nn 个 32 位 整数 的 列表 中 找 出 所 包含 的 负 整 数 的 个 数 ， 并 将 该 计数 保存 
在 单元 NEGNUM 中 。n 保存 在 存储 单元 N 中 ， 列 表 中 的 第 一 个 整数 保存 在 单元 NUMBERS 中 。 
在 程序 中 包含 必要 的 汇编 指示 ( assembler directive ) 和 一 个 样本 列表 ， 列 表 中 含有 6 个 数字 ， 其 
中 一 些 是 负数 。 

[E] B.4 为 图 B-3 中 的 程序 写 一 个 如 图 B-8 所 示 风 格 的 汇编 语言 程序 。 假 设 采 用 图 2-10 所 示 的 数据 布局 。 

[M] B.5 写 一 个 Nios [I 程序 来 解决 第 2 章 的 习题 2.10 中 的 问题 。 

[E] B.6 写 一 个 Nios II 程序 来 解决 第 2 章 中 例 2.5 所 描述 的 问题 。 

[M] B.7 写 一 个 Nios II 程序 来 解决 第 3 章 中 例 3.5 所 描述 的 问题 。 
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[E] B.8 写 一 个 Nios II 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 

[E] B.9 假设 TABLE 的 地 址 是 0x10100， 写 一 个 Nios I 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 

[E] B.10 写 一 个 程序 ， 在 视频 显示 器 的 一 行 上 以 十 六 进 制 形 式 显示 主 存 中 10 个 字 节 的 内 容 。 该 字 节 
串 在 存储 器 中 的 起 始 位 置 是 LOC。 每 个 字 节 将 显示 为 两 个 十 六 进 制 字 符 。 连 续 字 节 应 以 空 
格 分 隔 。 

[M] B.11 假设 存储 单元 BINARY 中 包含 一 个 16 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显示 
设备 上 将 这 些 位 显示 为 0 和 1 组 成 的 字符 串 。 写 一 个 程序 完成 这 个 任务 。 

[M] B.12 使 用 图 3-17 中 的 七 段 显示 器 和 图 3-14 中 的 定时 器 电路 ， 写 一 个 程序 ， 显 示 重 复 序列 0、1、2、…、 
9、0、… 中 的 十 进 制 数字 ， 每 个 数字 显示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 100 MHz 的 
时 钟 驱动 的 。 

[D] B.13 使 用 两 个 图 3-17 所 示 的 七 段 显 示 器 和 图 3-14 所 示 的 定时 器 电路 ， 写 一 个 程序 ， 显 示 重 复 序列 
0、1、2、…、98、99、0、… 中 的 数 ， 每 个 数 显 示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 
100 MHz 的 时 钟 驱动 的 。 

[D] B.14 写 一 个 程序 ， 计 算 实 时 时 钟 时 间 并 以 小 时 (0 ~ 23 ) 和 分 钟 (0 一 59-) 的 形式 显示 时 间 。 显 示 
器 包括 4 个 图 3-17 所 示 的 七 段 显示 设备 。 还 有 一 个 具有 图 3-14 所 示 接 口 的 定时 器 电路 ， 其 计 
数 器 是 由 100 MHz 的 时 钟 驱 动 的 。 

[M] B.15 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.22 中 的 问题 。 

[D] B.16 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.24 中 的 问题 。 

[M] B.17 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.25 中 的 问题 。 

[M] B.18 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.26 中 的 问题 。 

[M] B.19 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.27 中 的 问题 。 

[M] B.20 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.28 中 的 问题 。 

[M] B.21 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.29 中 的 问题 。 

[M] B.22 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.30 中 的 问题 。 

[M] B.23 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.31 中 的 问题 。 

[D] B.24 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.32 中 的 问题 。 

[D] B.25 写 一 个 Nios II 程序 来 解决 第 2 章 的 习题 2.33 中 的 问题 . 

[M] B.26 写 一 个 Nios II 程序 来 解决 第 3 章 的 习题 3.19 中 的 问题 。 

[M] B.27 写 一 个 Nios II 程序 来 解决 第 3 章 的 习题 3.21 中 的 问题 。 

[D] B.28 写 一 个 Nios II 程序 来 解决 第 3 章 的 习题 3.23 中 的 问题 。 

[D] B.29 写 一 个 Nios II 程序 来 解决 第 3 章 的 习题 3.25 中 的 问题 。 
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ColdFire 处 理 费 





附录 目标 

在 本 附录 中 ， 你 将 学 习 ColdFire 处 理 器 ， 它 是 CISC 风格 体系 结构 的 代表 。 本 附录 主要 讨论 : 

e 存储 器 组 织 和 寄存 器 结构 

e 寻 址 方式 和 指令 类 型 

e 计算 类 任务 和 IO 的 示例 程序 

e 浮 点 运算 的 扩展 

ColdFire 处 理 器 是 由 飞 思 卡 尔 半 导体 (Freescale Semiconductor ) 公司 生产 的 ， 该 公司 以 
前 曾 是 摩托 罗拉 公司 的 一 部 分 。ColdFire 是 在 20 世纪 90 年 代 中 期 推出 的 ， 是 从 摩托 罗拉 公司 
的 68000 处 理 器 衍生 而 来 的 。 自 推出 以 来 ，ColdFire 已 经 被 多 次 扩展 ， 增 加 了 新 的 功能 。 实 现 
ColdFire 指令 集 的 处 理 器 可 以 作为 预制 芯片 ， 也 可 以 作为 可 在 现场 可 编程 门 阵列 (FPGA ) 芯 
片 中 实现 的 软件 设计 ， 这 两 种 类 型 的 实现 常用 于 组 入 式 应 用 中 。 

在 2.9 节 和 2.10 节 的 讨论 中 ， 我 们 已 经 选择 ColdFire 作为 CISC 风格 处 理 器 设计 的 一 个 例 
子 。ColdFire 包括 许多 可 将 存储 器 访问 和 算术 逻辑 运算 相 结合 的 指令 。 这 些 指 令 的 新 增 功能 使 
得 我 们 可 以 使 用 更 少 的 指令 来 执行 计算 任务 ， 从 而 减少 了 程序 占用 的 存储 器 空间 。 各 种 各 样 的 
寻 址 方式 使 得 指令 可 以 使 用 寄存 器 和 存储 器 操作 数 。 这 增加 了 开发 程序 的 灵活 性 ， 但 也 增加 了 
用 硬件 实现 指令 集 的 复杂 性 。 

本 附录 介绍 了 基本 的 ColdFire 指令 集 ( 由 飞 思 卡 尔 半 导体 在 “ColdFire 系列 程序 员 参 考 手 
册 ” 中 定义 的 修订 版 A )。 我 们 将 描述 存储 器 组 织 、 寄 存 器 结构 、 操 作 数 的 寻 址 方式 以 及 多 种 
指令 类 型 。 我 们 通过 实现 第 2 和 第 3 章 中 所 介绍 的 计算 任务 来 说 明 ColdFire 指令 的 使 用 。 同 时 
我 们 还 将 简要 介绍 对 基本 指令 集 的 浮 点 扩展 。 


C.1 存储 器 组 织 字 地 址 内 容 


ColdFire 的 字 长 为 16 位 。 数 据 0 
是 以 8 位 的 字 节 (byte)、16 位 的 字  ， 
(word ) 或 32 位 的 长 字 (longword ) 
为 单位 进行 处 理 的 。 地 址 是 由 32 
位 组 成 的 ， 且 存储 器 是 按 字 节 编 址 
的 。 从 指令 集 的 角度 来 看 ， 存 储 器 
是 按 图 C-1 所 示 的 方式 进行 组 织 
的 。 对 字 或 长 字 中 的 字 节 采用 大 端 ” i+2 
地 址 分 配方 式 。 


C.2 寄存 器 


长 字 
( 字 节 0 是 高 位 字 节 ) 





长 学 
(学 节 i 是 高 位 字 节 ) 


图 C-2 显示 了 ColdFire 的 寄存 p31_， 


| 这 | 
髓 ， 其 中 有 8 个 数据 寄存 器 ( data LS | 


register ) 和 8 个 地 址 寄存 器 ( address 图 C-1 ColdFire 处 理 器 中 字 节 的 大 端 存储 器 布局 
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register )， 每 个 寄存 器 的 长 度 都 是 32 位 。 数 据 寄存 器 D0 到 D7 可 用 作 算术 逻辑 运算 的 通用 寄 
存 器 或 者 其 他 用 途 。 地 址 寄存 器 A0 到 A7 主要 用 来 保存 确定 操作 数 的 存储 器 地 址 所 需要 的 信 
息 ， 其 中 一 个 地 址 寄存 器 A7 专门 用 作 处 理 器 的 堆栈 指针 ( Stack Pointer，SP )。 

还 有 一 个 状态 寄存 器 ( Status Register，SR )， 其 中 包含 四 个 条 件 码 标志 : N、V、Z 和 C， 
这 在 2.3.7 节 中 讨论 过 。 这 些 标 志 可 根据 算术 运算 、 逻 辑 运算 或 数据 传输 操作 的 结果 进行 设置 
或 清除 。 其 中 还 有 一 个 称 为 X (扩展 ) 的 额外 标志 ， 它 的 设置 或 清除 方式 同 C 标志 一 样 ， 但 它 
不 像 C 标志 那样 受 许多 指令 的 影响 。 在 对 那些 比 数据 寄存 器 的 大 小 (32 位 ) 大 的 数 进行 加 法 
或 减法 运算 时 ， 它 可 用 作 一 个 扩展 的 进位 输入 /进位 输出 位 ， 这 将 在 C.3.3 节 中 介绍 。 状 态 寄 
存 器 中 的 其 余 位 用 来 控制 处 理 器 的 行为 ， 这 将 在 C.6 节 中 进行 讨论 。 

< 一 一 长 字 一 | 


局 
一 一 字 一 一 | 


31 16 15 8 7 0 


maT i 
数据 寄存 器 
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C.3 指令 
ColdFire 指令 由 16、32 或 48 位 组 成 ， 在 存储 器 中 存储 为 一 个 、 两 个 或 三 个 连续 的 字 。 第 
一 个 字 是 指定 所 要 执行 操作 的 操作 码 ( OP-code )， 该 字 也 提供 了 一 些 寻 址 信息 。 如 果 某 一 给 定 
类 型 的 指令 需要 更 多 的 寻 址 信息 ， 便 可 以 在 一 个 或 者 两 个 扩展 字 ( extension word ) 中 提供 。 
大 多 数 算术 、 逻 辑 和 数据 移动 指令 都 有 两 个 操作 数 ， 可 用 汇编 语言 写成 如 下 形式 : 
OP source, destination 
该 指令 使 用 操作 数 执行 OP 操作 ， 并 将 结果 放 到 目的 单元 中 ， 覆 盖 其 原 有 的 值 。 请 注意 ,目的 
单元 是 第 二 个 操作 数 ， 这 个 顺序 与 第 2 章 中 讨论 的 CISC 风格 的 指令 不 同 。 
在 汇编 语言 中 ， 操 作 码 是 以 表示 所 要 执行 操作 的 助 记 符 以 及 表示 数据 操作 数 大 小 的 长 度 
说 明 符 的 形式 给 出 的 。 长 度 说 明 符 可 以 是 L、W 或 B， 分 别 表 示 长 字 、 字 或 字 节 。 例 如 ， 指 令 
ADD.L LOC,D1 
将 存储 单元 LOC 和 处 理 器 寄存 器 D1 中 的 32 位 操作 数 相 加 ， 并 将 和 放 到 D1 中 。 并 非 所 有 长 
度 的 操作 数 都 能 用 于 所 有 的 指令 ; 加 法 指令 只 支持 长 字 大 小 的 操作 数 进行 运算 。 
指令 的 汇编 语言 规范 必须 符合 汇编 程序 所 施加 的 约束 ( 汇编 程序 用 来 生成 可 执行 的 机 器 
语言 代码 )。 飞 思 卡 尔 半导体 公司 提供 的 汇编 程序 对 指令 助 记 符 和 寄存 器 名 称 是 大 小 写 敏 感 的 。 
ColdFire 的 技术 文档 [1] 一 贯 使 用 大 写字 符 。 为 了 符合 这 种 表示 风格 ， 并 使 示例 程序 更 容易 阅 
读 ， 我 们 使 用 大 写字 符 来 表示 所 有 的 指令 助 记 符 和 寄存 器 名 称 。 


C.3.1 寻 址 方式 


指令 的 操作 数 可 能 在 处 理 器 寄存 器 中 ， 也 可 能 在 存储 器 中 ， 或 者 作为 立即 值 包含 在 指令 
中 。 以 下 为 可 用 的 寻 址 方式 。 

立即 方式 (immediate mode ) 操作 数 是 一 个 常量 值 ， 直 接 包含 在 指令 中 。 可 以 指定 四 
种 大 小 的 立即 数 。 某 些 指令 的 操作 码 字 中 可 以 包含 小 的 3 位 数 。 操 作 码 字 之 后 可 以 跟 一 个 或 两 
个 扩展 字 ， 其 中 包含 字 节 、 字 和 长 字 操作 数 。 

绝对 方式 (absolute mode ) 一 一 操作 数 的 存储 器 地 址 紧 跟 在 指令 的 操作 码 字 之 后 。 这 种 方 
式 有 长 模式 和 短 模式 两 个 版 本 。 在 长 模式 中 ， 需 要 在 两 个 扩展 字 中 指定 一 个 完整 的 32 位 地 址 。 
在 短 模式 中 ， 只 需 在 一 个 扩展 字 中 给 出 一 个 16 位 的 值 ， 这 个 值 作为 完整 的 32 位 地 址 的 低 16 
位 。 为 确定 高 16 位 ， 需 要 将 短 值 的 符号 位 进行 扩展 。 因 此 ， 短 模式 只 能 访问 两 个 32 KB 的 存 
储 区 域 : 0 到 7FFF 或 FFFF8000 到 FFFFFFFF。 

寄存 器 方式 〈 register mode ) 一 一 操作 数 在 处 理 器 寄存 器 An 或 Dn 中 ， 该 寄存 器 在 指令 中 
指定 。 

寄存 器 间接 方式 ( register indirect mode ) 一 一 操作 数 的 有 效 地 址 在 地 址 寄存 器 An 中 ， 该 
寄存 器 在 指令 中 指定 。 

自 增 方式 ( autoincrement mode ) 操作 数 的 有 效 地 址 在 地 址 寄存 器 An 中 ， 该 寄存 器 在 
指令 中 指定 。 操 作 数 被 访问 后 ，An 的 值 递 增 1、2 或 4， 这 取决 于 操作 数 是 一 个 字 节 、 一 个 字 
还 是 一 个 长 字 。 

自 减 方式 (autodecrement mode ) 指令 中 指定 的 地 址 寄存 器 An 的 值 首先 递减 1、2 或 
4， 这 取决 于 操作 数 是 一 个 字 节 、 一 个 字 还 是 一 个 长 字 。 然 后 ， 操 作 数 的 有 效 地 址 就 由 递减 后 
的 An 值 给 出 。 

基本 变 址 方式 (basic index mode ) 在 指令 中 指定 一 个 16 位 的 有 符号 偏 移 量 和 一 个 地 
址 寄存 器 An。 偏 移 量 被 符号 扩展 为 32 位 ， 符 号 扩展 后 的 偏 移 量 与 32 位 的 An 值 之 和 为 操作 
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数 的 有 效 地 址 。 

完全 变 址 方式 ( full index mode ) 在 指令 中 给 出 一 个 8 位 的 有 符号 偏 移 量 、 一 个 地 址 
寄存 器 An 和 一 个 变 址 寄存 器 Rk ( 地 址 或 数据 寄存 器 )。 操 作 数 的 有 效 地 址 是 符号 扩展 后 的 偏 
移 量 与 寄存 器 An 中 的 值 以 及 寄存 器 Rk 中 的 有 符号 值 相 加 的 和 。 

基本 相对 方式 (basic relative mode ) 这 种 方式 与 基本 变 址 方式 相同 ， 但 是 用 程序 计数 
器 (PC ) 代替 地 址 寄存 器 An。 

完全 相对 方式 ( full relative mode ) 
器 (PC ) 代替 地 址 寄存 器 An。 

寻 址 方式 及 其 汇编 语法 在 表 C-1 中 进行 了 总 结 。 基 本 变 址 方式 和 完全 变 址 方式 对 应 于 
2.4.3 节 中 讨论 的 变 址 寻 址 方式 。 两 种 相对 方式 是 变 址 方式 使 用 程序 计数 器 而 不 使 用 地 址 寄存 
器 的 版 本 。 在 这 些 寻 址 方式 中 ， 偏 移 量 表示 所 需 操作 数 的 存储 单元 与 访问 该 操作 数 的 指令 之 后 
的 那个 单元 之 间 的 距离 。 








这 种 方式 与 完全 变 址 方式 相同 ， 但 是 用 程序 计数 





表 C-1 ColdFire 寻 址 方式 





方式 名 区 ET 
立即 方式 操作 数值 
短 绝对 方式 EA= 符号 扩展 后 的 WValue 
长 绝对 方式 EA- 值 
寄存 器 方式 EA=R,， 即 操作 数 =[R] 
寄存 器 间接 方式 EA=[Aj] 
自 增 方式 (An)+ EA=[A,]; 递增 A 
自 减 方式 —(An) 递减 A,; EA=[Ai] 
基本 变 址 方式 WValue(An) EA= WValue + [Ai] 
完全 变 址 方式 EA= BValue + [A;] +{R4] 
基本 相对 方式 WValue(PC) EA = WValue + [PC] 
完全 相对 方式 BValue(PC, Rk) EA = BValue + [PC] + [R#] 
EA= 有 效 地 址 


Value= 明确 给 出 的 或 用 标签 表示 的 数 
BValue=8 位 的 值 

WValue=16 位 的 值 

A,= 地 址 寄存 器 

R,= 地 址 寄存 器 或 数据 寄存 器 


最 后 ， 重 要 的 是 要 注意 ， 并 非 所 有 指令 都 支持 所 有 的 寻 址 方式 或 所 有 的 操作 数 大 小 。 不 
同类 别 的 指令 在 寻 址 方式 和 操作 数 大 小 上 的 一 些 限制 将 在 本 附录 后 面部 分 进行 说 明 。ColdFire 
处 理 器 的 技术 文档 对 一 些 指令 的 有 效 组 合 提供 了 完整 的 细节 信息 [1]。 


C.3.2 ”Move 指令 

Move (传送 ) 指令 在 存储 器 或 IO 接口 与 处 理 器 寄存 器 之 间 传 输 数据 ， 传 输 的 方向 是 从 
源 端 到 目的 端 。 如 果 Move 指令 所 传输 的 值 是 零 或 者 负数 ， 那 么 该 值 会 使 得 状态 寄存 器 中 的 条 
件 标 志 位 Z 或 N 被 置 为 1。 该 指令 可 使 用 所 有 的 三 种 大 小 的 操作 数 ， 源 操作 数 可 使 用 所 有 可 
用 的 寻 址 方式 。 至 于 目的 操作 数 ， 则 允许 使 用 除了 立即 方式 和 相对 方式 之 外 的 其 他 所 有 寻 址 方 
式 。 为 确保 指令 的 长 度 不 超过 三 个 字 ， 不 允许 使 用 源 操作 数 和 目的 操作 数 的 寻 址 方式 的 某 些 组 
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合 。 例 如 ， 源 操作 数 和 目的 操作 数 不 能 都 使 用 绝对 方式 ( 短 模式 或 长 模式 )。 

为 了 说 明 如 何 指定 不 同 的 寻 址 方式 和 不 同 的 操作 数 大 小 ， 考 虑 以 下 指令 : 

MOVE.L Do0, (A2) 
它 将 一 个 32 位 的 值 从 寄存 器 D0 写 到 其 地 址 由 寄存 器 A2 的 内 容 给 出 的 存储 单元 中 。 同 样 ， 
指令 
MOVE.B _ CHARACTER, D3 

将 一 个 8 位 的 值 从 存储 单元 CHARACTER 传输 到 寄存 器 D3 中 。 该 传输 操作 只 改变 寄存 器 D3 
的 低位 字 节 ; 其 余 的 位 不 会 受到 影响 。 

寄存 器 之 间 也 可 以 进行 数据 传输 ， 如 

MOVE.W D5,D7 

它 将 寄存 器 D5 中 的 低 16 位 值 传 输 到 寄存 器 D7 的 低位 中 ，D7 的 高 位 不 受 影响 。 

也 可 以 在 存储 单元 之 间 进 行 直接 的 数据 传输 ， 如 

l MOVE.L (A2),16(A4) ” 

它 将 一 个 32 位 的 值 从 地 址 由 寄存 器 A2 的 内 容 给 出 的 存储 单元 传输 到 有 效 地 址 为 寄存 器 A4 的 
值 加 上 16 的 存储 单元 中 。 

可 通过 以 下 指令 将 一 个 立即 值 装 入 一 个 寄存 器 或 存储 单元 中 : 

MOVE.L #$2A4C80,D7 

该 指令 将 指定 的 十 六 进 制 值 装 人 寄存 器 D7 地址 内 容 
中 。 需 要 注意 的 是 ，'$” 字符 用 来 表示 一 
个 十 六 进 制 值 。 因 为 有 L 这 个 大 小 说 明 符 ， 
所 以 目的 操作 数 的 所 有 32 位 都 会 受到 影 
响 ， 因 此 D7 中 的 结果 值 将 是 002A4C80。 
图 C-3 显示 了 该 指令 是 如 何 存储 在 存储 器 
中 的 。 操 作 码 字 表 明 这 是 一 条 MOVE 指 图 C-3 存储 器 中 的 指令 MOVE.L #$2A4C80, D7 
令 ， 并 指定 了 操作 数 的 大 小 。 它 还 指定 了 源 操作 数 和 目的 操作 数 的 寻 址 方式 ， 其 中 包括 指定 
寄存 器 D7 是 目的 单元 。 操 作 码 字 之 后 的 两 个 扩展 字 包 含 源 操作 数 的 32 位 立即 值 。 

MOVE 指令 有 两 个 专门 的 版 本 。MOVEQ ( Move Quick， 快 速 传送 ) 指令 在 源 操作 数 是 
一 个 足够 小 的 、 可 以 在 8 位 中 容纳 的 立即 值 并 且 目 的 操作 数 是 一 个 数据 寄存 器 的 时 候 使 用 。 
这 条 指令 的 长 度 只 有 一 个 字 的 大 小 。MOVEA 指令 在 目的 单元 是 一 个 地 址 寄存 器 的 时 候 使 
用 。MOVEA 指令 只 允许 使 用 字 和 长 字 操 作 数 。 状 态 寄 存 器 中 的 条 件 码 不 受 这 条 指令 的 影响 。 
ColdFire 汇编 程序 会 在 适当 的 地 方 用 MOVEQ 或 MOVEA 指令 取代 正常 的 MOVE 指令 。 

还 有 一 条 指令 MOVEM (Move Multiple Registers， 多 个 寄存 器 传送 )， 它 执行 包含 数 个 寄 
存 器 的 多 次 传送 ， 可 用 于 C.3.7 节 所 讨论 的 子 程序 链接 中 。 


C.3.3 ”算术 指令 

这 一 类 指令 包括 算术 运算 以 及 比较 、 符 号 扩展 、 取 反 和 清空 操作 。 操 作 数 可 以 在 存储 器 
中 、 数 据 寄存 器 中 或 者 包含 在 指令 中 作为 立即 值 。 本 节 讨 论 的 所 有 算术 指令 ， 除 了 其 中 的 四 条 
之 外 ， 其 他 的 都 只 允许 长 字 大 小 的 操作 数 。 除 一 条 指令 外 ， 其 他 指令 都 需要 至 少 一 个 寄存 器 操 
作 数 。 

1. 加 法 、 减 法 、 比 较 和 取 反 

这 种 类 型 的 指令 有 : 





立即 值 的 高 16 位 
立即 值 的 低 16 位 
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ADD.L (加 ) 

ADDIL (加 立即 数 ) 

ADDA.L (加 地 址 ) 

SUB.L ( 减 ) 

SUBIL ( 减 立 即 数 ) 

SUBA.L( 减 地 址 ) 

CMP.L (比较 ) 

CMPIL ( 比较 立即 数 ) 

CMPA.L ( 比较 地 址 ) 

NEG.L ( 取 反 ; 一 个 数据 寄存 器 操作 数 ) 
ADDX.L (扩展 加 ; 两 个 数据 寄存 器 操作 数 ) 
SUBX.L (扩展 减 ; 两 个 数据 寄存 器 操作 数 ) 
NEGX.L ( 扩展 取 反 ; 一 个 数据 寄存 器 操作 数 ) 

ADD 和 SUB 指令 对 两 个 长 字 操 作 数 执行 指定 的 算术 运算 并 将 结果 放 在 目的 单元 中 。SUB 
指令 将 目的 操作 数 减 去 源 操 作 数 。 根 据 所 得 的 结果 ， 所 有 的 条 件 码 标志 都 会 受到 影响 。 

CMP 指令 用 于 比较 长 字 的 值 。 目 的 操作 数 必须 在 寄存 器 中 。 该 指令 与 SUB 指令 执行 相同 
的 操作 ， 但 它 不 会 改变 目的 操作 数 的 值 。 除 了 X 标志 外 ， 该 指令 的 结果 会 影响 其 他 所 有 的 条 
件 码 标志 。 

还 有 专用 版 本 的 ADD、SUB 和 CMP 指令 ， 用 于 两 种 情况 : 当 源 操 作 数 是 一 个 立即 值 
(ADDI、SUBI 和 CMPI) 时 和 当 目 的 操作 数 是 一 个 地 址 寄存 器 (ADDA、SUBA 和 CMPA ) 时 。 
ColdFire 汇编 程序 会 在 适当 的 地 方 用 这 些 指令 的 专用 版 本 替换 其 正常 版 本 。 

考虑 下 面 的 例子 ， 指 令 


ADD.L D4, (AD+ 
将 D4 寄存 器 中 的 长 字 加 上 由 寄存 器 Al 给 定 的 存储 单元 中 的 长 字 ， 并 将 和 放 到 同一 存储 单元 
中 。 寄 存 器 Al 中 的 值 递增 4。 指令 
SUBIL #256,D7 
将 寄存 器 D7 的 内 容 减 去 256， 并 将 其 结果 放 到 D7 中 。 注 意 ， 指 令 
CMPIL #256,D7 
执行 相同 的 减法 运算 ,但 不 改变 寄存 器 D7 的 内 容 。 除 了 XX 标志 外 ， 其 他 所 有 的 条 件 码 标志 都 
以 与 SUB 指令 同样 的 方式 受到 影响 。 
NEG.L 指令 用 来 对 数据 寄存 器 中 的 长 字 操 作 数 取 反 。 取 反 操 作 是 通过 用 0 减 去 数据 寄存 
器 的 值 来 实现 的 。 根 据 所 得 的 结果 ， 所 有 的 条 件 码 标志 都 会 受到 影响 。 指 令 
NEG.L D3 
将 寄存 器 D3 中 的 长 字 取 反 并 用 取 反 后 的 值 覆 盖 原 来 的 值 。 
为 了 方便 对 大 于 32 位 的 值 进行 算术 运算 ，ADDX.L、SUBX.L 和 NEGX.L 指令 将 X 标 志 
用 作 一 个 进位 输入 位 。 所 有 的 操作 数 都 必须 在 数据 寄存 器 中 。 所 有 条 件 码 标志 都 会 受到 影响 。 
例如 ， 图 C-4 显示 了 ADDX 指令 是 如 何 用 来 将 不 能 在 32 位 寄存 器 中 容纳 的 大 数 相 加 的 。 将 两 
个 十 六 进 制 值 10A72C10F8 和 4A5C00FE04 相 加 。10A72C10F8 的 低位 和 高 位 被 分 别 装 入 寄存 
器 D2 和 D3 中 。 同 样 ，4A5C00FE04 的 低位 和 高 位 被 分 别 装 和 人 寄存 器 D4 和 D5 中 。ADD.L 指 
令 用 来 将 低 32 位 相 加 ,产生 进位 输出 1， 使 得 X 标 志和 C 标志 被 置 为 1。 然 后 ， 当 高 位 部 分 
相 加 时 ，ADDX.L 指令 将 X 标志 的 新 值 作为 进位 输入 位 。 相 加 和 的 低位 和 高 位 分 别 保存 在 寄 
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存 器 D4 和 D5 中 。C 标志 和 XX 标志 都 会 受到 ADDX.L 指令 结果 的 影响 ， 但 在 这 个 例子 中 ， 它 
们 将 不 会 被 使 用 ， 因 为 所 需 的 64 位 加 法 已 经 完成 了 。 


#$A72C10F8, D2 ”D2 中 的 值 为 A72C10F8 
#$10, D3 D3 中 的 值 为 10 
#$5COOFE04, D4 ”D4 中 的 值 为 SCOOFE04 


#$4A, D5 D5 中 的 值 为 4A 
D2, D4 将 低 32 位 相 加 ; 根据 进位 输出 位 设置 X 和 C 标志 


D3, D5 以 X 标志 为 进位 输入 位 ， 将 高 位 部 分 相 加 
图 C-4 使 用 ADDX 指令 将 大 于 32 位 的 数 相 加 的 程序 





2. 乘法 

使 用 MULS 和 MULU 指令 可 分 别 对 有 符号 和 无 符号 操作 数 执行 乘法 运算 。 操 作 数 的 大 小 
可 以 是 字 或 长 字 。 目 的 操作 数 必须 在 数据 寄存 器 中 。 

指令 

MULS.W #1340,D5 

将 1340 与 寄存 器 D5 中 的 低 16 位 有 符号 值 相 乘 ， 并 将 32 位 的 乘积 放 到 D5 中 。 

指令 

MULS.L D2,D5 

将 寄存 器 D2 和 D5 中 的 长 字 相 乘 ， 并 将 乘积 截取 为 32 位 ， 放 到 D5 中 。 

MULU.W 和 MULULL 指令 对 无 符号 操作 数 执行 相同 的 操作 。 作 为 乘法 运算 的 结果 ，N 和 
Z 条件 码 标志 会 根据 乘积 的 值 来 置 为 1 或 清 为 零 ， 而 V 和 C 标志 被 清 为 零 。 

图 C-5 显示 了 对 同一 对 字 操 作 数 SFFFF 和 $0001 进行 有 符号 和 无 符号 乘法 运算 时 获得 的 
不 同 结果 。 图 C-5a 中 的 MULS.W 指令 将 寄存 器 D2 中 $FFFF 的 低位 字 的 值 视 为 -1。 有 符号 乘 
法 运算 的 长 字 结 果 为 SFFFFFFFF， 表 示 -1， 并 将 N 标志 置 为 1。 而 图 C-5b 中 的 MULU.W 指 
令 将 SFFFF 看 做 无 符号 数 65535， 且 无 符号 乘法 运算 的 长 字 结 果 为 $0000FFFF， 表 示 65 535， 
并 将 N 标志 清 零 。 


#$FFFF, D2 ”D2 的 低位 字 被 视 为 -1 
#$0001, D3 ”D3 的 低位 字 包 含 1 


D2, D3 D3 中 的 有 符号 长 字 结果 为 -1 或 
$FFFFFFFF， 因 此 N 标志 被 置 为 1 


a) -1x1l=-1 的 有 符号 计算 





#$FFFF, D2 ”D2 的 低位 字 被 视 为 65 535 
#$0001, D3 ”D3 的 低位 字 包 含 1 


D2, D3 D3 中 的 无 符号 长 字 结 果 为 65 535 或 
$0000FFFF， 因 此 N 标志 被 清 零 





b ) 65 535 x 1 = 65 535 的 无 符号 计算 
图 C-5 有 符号 乘法 与 无 符号 乘法 的 对 比 

3. 除法 

使 用 DIVS 和 DIVU 指令 可 分 别 对 有 符号 和 无 符号 操作 数 执行 除法 运算 。 操 作 数 的 大 小 可 
以 是 字 或 长 字 。 目 的 操作 数 必须 在 数据 寄存 器 中 。 

指令 

DIVS.W #2500, D1 

将 寄存 器 D1 中 的 32 位 值 除 以 16 位 的 立即 操作 数 2500。16 位 的 商 被 放 到 D1 的 低位 中 ，16 
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位 的 余数 被 放 到 D1 的 高 位 中 。 

指令 

DIVSL D2,D!I 

将 D1 中 的 值 除 以 D2 中 的 值 ， 并 将 商 放 到 D1 中 ,余数 被 丢弃 。 

DIVU.W 和 DIVU.L 指令 对 无 符号 操作 数 执行 相同 的 操作 。 作 为 除法 运算 的 结果 ，N 和 Zz 
条 件 码 标志 会 根据 商 的 值 来 置 为 1 或 清 为 零 ， 而 V 和 C 标志 被 清 为 零 。 

由 于 DIVS.L 和 DIVU.L 操作 中 的 余数 被 丢弃 ， 所 以 还 有 两 条 其 他 的 指令 ， 用 来 在 需要 的 
时 候 获 得 余数 。 指 令 

REMS.L D2,D1:D4 
将 D1 中 的 值 除 以 D2 中 的 值 ， 将 32 位 的 余数 放 到 寄存 器 D4 中 ， 并 使 D1 的 值 保持 不 变 。 因 
此 ， 如 果 该 指令 后 跟 有 以 下 指令 : 
DIVSL D2,D!1 

则 余数 和 商都 可 以 获得 。 需 要 注意 的 是 ， 由 冒号 界定 的 第 三 个 操作 数 必须 在 REMS.L 指令 中 
指定 。 

REMU.L 指令 与 REMS.L 指令 执行 相同 的 操作 ,但 它 是 对 无 符号 操作 数 进行 操作 ， 同 样 
也 需要 三 个 操作 数 。 

4. 其 他 算术 指令 

当 增 加 表示 一 个 数 的 位 数 时 ，EXT ( 符号 扩展 ) 指令 可 用 来 对 符号 位 进行 扩展 。 它 只 有 一 
个 操作 数 且 必须 在 数据 寄存 器 中 。 所 指定 的 大 小 决定 该 操作 如 何 执 行 。EXT.L 指令 将 低位 字符 
号 扩展 为 一 个 长 字 ，EXTW 指令 将 低位 字 节 符号 扩展 为 一 个 字 ， 而 EXT.B 指令 将 低位 字 节 符 
号 扩展 为 一 个 长 字 。 对 于 所 有 这 三 条 指令 来 说 ，N 和 Z 条 件 码 标志 都 会 受到 指令 结果 的 影响 ， 
且 V 和 C 标 志 被 清 为 零 。 

CLR( 清除 ) 指令 可 用 来 清除 指定 操作 数 中 的 位 。 大 小 说 明 符 说 明 将 要 清除 的 是 一 个 长 字 、 
一 个 字 还 是 一 个 字 节 。 该 操作 数 可 能 在 存储 器 中 ， 也 可 能 在 数据 寄存 器 中 。 该 指令 会 将 乙 标 
志 置 为 1， 并 将 N、V 和 C 标志 清 为 零 。 


已 人 


条 件 转移 指令 具有 如 下 的 格式 : 条 件 后 缀 cc 测试 条 件 
Bcc LABEL HI CVZ=0 

其 中 cc 指定 条 件 码 。 表 C-2 总 结 了 条 件 码 和 一 些 LS CVZ=1l 
要 测试 的 条 件 码 标志 组 合 。 例 如 ， 如 果 Z 标志 cc c=0 
设置 为 1， 则 BEQ ( Branch-if-equal， 如 果 等 于 则 _ DS C=1 
转移 ) 指令 会 导致 一 个 转移 ， 而 BGE ( Branch-if- NE z=0 
greater-than-or-equal， 如 果 大 于 等 于 则 转移 ) 指令 ER 
则 依赖 于 N 和 V 标志 的 状态 。 还 有 一 条 无 条 件 转 ”一 一 oe 
移 指令 BRA， 始 终 会 产生 转移 。 i 0 

转移 指令 指定 一 个 有 符号 的 偏 移 量 ， 该 偏 移 MI N=1 
量 与 程序 计数 器 中 的 值 相 加 ， 以 确定 目标 地 址 。 一 GE ER 
根据 转移 指令 之 后 的 那个 单元 与 转移 目标 之 间 的 LT N@V=1 
距离 ， 可 提供 三 种 类 击 的 偏 移 量 。 第 一 种 类 型 中 ， GT ZV (NOV)=0 
当 转 移 距离 在 土 127 字 节 之 内 时 ， 在 操作 码 字 中 LE zZVNe@V=l 
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包含 一 个 较 小 的 8 位 偏 移 量 。 第 二 种 类 型 中 ， 当 转移 距离 高 达 土 32K 字 节 时 ， 在 操作 码 字 之 
后 的 扩展 字 中 指定 一 个 较 大 的 16 位 偏 移 量 。 第 三 种 类 型 中 ， 当 到 转移 目标 的 距离 超过 16 位 偏 
移 量 所 支持 的 范围 时 ， 可 在 两 个 扩展 字 中 指定 一 个 32 位 的 偏 移 量 。 
JMP ( 跳 转 ) 指令 执行 一 个 无 条 件 跳 转 操作 ， 跳 转 到 下 一 条 要 执行 指令 的 位 置 。 用 一 个 单 
一 的 操作 数 来 指定 目标 地 址 。JMP 指令 中 可 使 用 的 寻 址 方式 有 绝对 寻 址 、 间 接 寻 址 、 基 本 和 完 
全 变 址 寻 址 方式 ， 以 及 基本 和 完全 相关 寻 址 方式 。 例 如 ， 指 令 
JIMP (A3) 
跳 转 到 地 址 寄存 器 A3 的 内 容 所 指定 的 位 置 。 
为 了 说 明 转 移 指令 在 一 个 循环 中 的 使 用 ， 图 C-6 给 出 了 图 2-26 中 将 一 个 列表 中 数字 相 加 
的 循环 程序 的 ColdFile 版 本 。ADD.L 指令 中 使 用 自 增 寻 址 方式 来 自动 增加 指向 列表 项 的 指针 。 
BGT ( Branch-if-greater-than， 如 果 大 于 则 转移 ) 指令 用 来 检查 根据 SUBQ.L 指令 的 执行 结果 而 
设置 或 清除 的 条 件 码 标志 。SUBQ.L 指令 用 来 递减 列表 中 剩余 的 待 处理 元 素 个 数 的 计数 ， 该 指 
令 是 立即 值 可 用 3 位 表示 时 所 使 用 的 SUBI 指令 的 另 一 个 版 本 。 
#NUM1, A2 将 地 址 NUMI 放 到 A2 中 
N, DI1 将 列表 的 项 数 n 放 到 D1 中 


D0 
(A2)+,D0 ”将 和 累加 到 D0 中 


#1, D1 
LOOP 
DO, SUM 结束 时 保存 结果 





图 C-6 图 2-26 中 将 列表 中 数字 相 加 程序 的 ColdFire 版 本 


图 C-7 显示 了 具有 小 偏 移 量 的 条 件 转移 指令 的 格式 以 及 图 C-6 的 程序 其 循环 中 的 三 条 指令 

是 如 何 存储 在 存储 器 中 的 。BGT 指令 需要 有 一 个 负 的 偏 移 量 ， 可 由 以 下 算式 计算 得 到 : 

偏 移 量 = 目标 地 址 - [PC] 
目标 地 址 为 1000。 在 BGT 指令 执行 时 ，PC 的 值 将 是 1006， 这 是 因为 提取 了 BGT 指令 的 操作 
码 字 之 后 PC 的 值 会 增加 。 因 此 ， 偏 移 量 为 1000 - 1006 = -6。8 位 的 偏 移 量 足 以 存储 这 个 较 小 
的 值 ， 这 意味 着 该 BGT 指令 只 需要 使 用 一 个 字 来 进行 编码 。 

15 87 0 

转移 地 址 = [ 更 新 后 的 PC 值 ] + 偏 移 量 
a ) 短 偏 移 量 转移 指令 的 格式 





LOOP 1000 LOOP: ADDL (A2)+,DO 
1002 SUBQL #1,DI1 
1004 BGT LOOP 
1006 
循环 在 存储 器 中 的 表示 循环 的 汇编 语言 版 本 


在 计算 转移 地 址 时 ，[PC] = 1006 
转移 地 址 =1006--6=1000 
b ) 在 图 C-6 的 循环 中 使 用 转移 指令 的 例子 
图 C-7 转移 指令 的 格式 及 其 在 存储 器 中 的 表示 
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图 C-8 给 出 了 一 个 更 复杂 的 例子 ， 该 例子 说 明了 指令 的 一 些 其 他 方面 的 信息 。 它 是 
图 2-11 中 计算 一 组 学 生 参 加 三 项 测验 得 到 的 所 有 分 数 之 和 程序 的 ColdFire 版 本 。ADD 指令 中 
可 使 用 基本 变 址 寻 址 方式 访问 存储 器 操作 数 ， 这 样 就 省 却 了 图 2-11 中 循环 体内 的 Load 指令 。 


MOVEA.L #LIST,A2 获取 地 址 LIST 

CLR.L D3 

CLR.L D4 

CLR.L D5 

MOVEL NN,D6 载 人 nn 值 

ADD.L 4(A2), D3 加 上 当前 学 生 的 测验 1 分 数 


ADD.L 8(A2), D4 加 上 当前 学 生 的 测验 2 分 数 
ADD.L 12(A2), D5 “加 上 当前 学 生 的 测验 3 分 数 
ADDA.L #16,A2 递增 指针 

SUBQ.L #1, D6 递减 计数 器 

BGT LOOP 如 果 没 有 结束 ， 循 环 回 到 前 面 
MOVE.L ”D3,SUMI1 ”保存 测验 1 的 总 分 数 
MOVE.L ”D4,SUM2 保存 测验 2 的 总 分 数 
MOVE.L ”D5,SUM3 ”保存 测验 3 的 总 分 数 





图 C-8 ”图 2-11 中 求 测验 分 数 总 和 程序 的 ColdFire 版 本 


C.3.5” 肥 辑 指令 
逻辑 指令 需要 长 字 操作 数 ， 并 且 至 少 有 一 个 操作 数 必 须 在 数据 寄存 器 中 。 有 如 下 的 逻辑 
指令 : 
AND.L ( 按 位 逻辑 与 ) 
ANDILL ( 按 位 逻辑 与 ; 源 操作 数 是 一 个 立即 值 ) 
OR.L ( 按 位 逻辑 或 ) 
ORIL ( 按 位 逻辑 或 ; 源 操作 数 是 一 个 立即 值 ) 
EOR.L ( 按 位 逻辑 异 或 ， 源 操作 数 必须 在 数据 寄存 器 中 ) 
EORI.L ( 按 位 逻辑 异 或 ; 源 操 作 数 是 一 个 立即 值 ) 
e NOT.L ( 按 位 求 补 ; 单一 一 个 数据 寄存 器 操作 数 ) 
根据 指令 的 结果 ， 所 有 逮 辑 指令 都 会 影响 N 和 Z 条件 码 标志 ; V 和 C 标志 被 清 为 零 。 
例如 ， 指 令 


ANDILL #4$FF,D5 
对 十 六 进 制 值 000000FF 和 数据 寄存 器 D5 中 的 长 字 执行 按 位 逻辑 “与 ”操作 ， 并 将 结果 放 到 
D5 中 。 指 令 

EOR.L D3,(A6)+ 
对 寄存 器 D3 中 的 长 字 和 由 寄存 器 A6 的 内 容 给 出 的 存储 器 地 址 中 的 长 字 执 行 按 位 逻辑 “ 异 或 ” 
操作 ， 并 将 结果 放 到 该 存储 器 地 址 中 。 人 然后， 寄存 器 A6 的 内 容 递增 4。 


C.3.6 ”Shift 指令 


Shift ( 移 位 ) 指令 有 两 个 操作 数 : 目的 操作 数 必 须 在 数据 寄存 器 中 ， 该 寄存 器 保存 将 被 移 
位 的 长 字 ;， 源 操作 数 指定 要 移动 的 位 数 ， 它 要 么 是 一 个 立即 数 ， 要 么 是 一 个 数据 寄存 器 中 的 内 
容 。 立 即 值 必须 是 1 ~~ 8 的 数 ， 被 编码 在 指令 中 。 如 果 要 移动 的 位 数 在 数据 寄存 器 中 ， 那 么 它 
的 值 会 被 解释 为 对 64 取 模 ， 尽 管 数据 寄存 器 的 大 小 只 是 32 位 。 

对 于 所 有 的 移 位 指令 来 说 ， 从 目的 数据 寄存 器 移出 的 最 后 一 位 被 复制 到 C 和 X 条 件 码 标 
志 中 。 每 个 被 移动 到 目的 数据 寄存 器 中 的 位 都 是 0， 除了 算术 右 移 时 bs 位 上 的 符号 值 会 保留 。 
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2.23 给 出 了 每 一 种 移 位 的 情况 。 根 据 移 位 后 的 最 终结 果 ，N 和 了 Z 标志 会 受到 影响 ，V 标志 

可 用 的 移 位 指令 有 : 

e LSL.L (逻辑 左 移 ) 

e LSR.L ( 逻辑 右 移 ) 

e@ ASL.L (算术 左 移 ) 

e ASR.L (算术 右 移 ; 符号 位 被 保留 ) 

下 面 的 例子 说 明 移 位 操作 之 间 的 差异 。 假 设 数据 寄存 器 D4 中 的 初 值 为 十 六 进 制 数 
80000000 (ba 位 是 1， 其 他 位 都 是 0 )。 指 令 

LSR.L #6,D4 

将 D4 中 的 值 右 移 6 位， 并 在 左 端 插入 0。D4 中 的 结果 为 十 六 进 制 数 02000000。 因 为 从 D4 移 
出 的 最 后 一 位 是 0， 所 以 C 和 X 标志 被 清 为 零 。 

如 果 D4 中 的 初 值 相同 ， 指 令 

ASR.L #6,D4 

也 将 D4 中 的 值 右 移 6 位 ， 但 保留 bs 位 上 的 符号 位 。 这 样 ， 移 到 数据 寄存 器 最 左 端的 位 都 是 
1。D4 中 的 结果 为 十 六 进 制 数 FE000000。 因 为 被 移出 的 最 后 一 位 是 0， 所 以 C 和 XX 标志 被 清 

考虑 图 2-24 中 的 BCD 数字 打包 程序 。 该 程序 的 ColdFire 版 本 如 图 C-9 所 示 。 在 连续 的 存 
储 器 字 节 单元 中 的 两 个 ASCII 编码 字符 被 「 MovEAL #LOC,A0 A0 指向 两 个 连续 的 字 节 
放 到 寄存 器 DO 和 DI 中 。LSL 指 令 将 DO | MOVEB (A0)+,D0 sr D0 中 
中 的 第 一 个 字 节 左 移 4 位 ， 用 零 填充 低 四 | MOVEB (A0),DI 将 第 二 个 字 节 装 和 人 D1 中 
位 。ANDI 指令 将 寄存 器 D1 中 的 所 有 高 位 ANDIL #$F, D1 将 D1 中 所 有 的 高 位 清 零 


OR.L D0, D1 连接 数字 
都 清 为 零 。 随 后 ， 所 需 BCD 码 的 4 位 模式 | MOVE.B Dl,PACKED 保存 结果 


通过 OR 指令 合并 到 D1 中 。 最 后 ,我 们 感 a 

兴趣 的 字 节 ， 寄 存 器 D1 最 右边 的 字 节 ， 被 图 C-9 逻辑 和 移 位 指令 在 BCD 数字 打包 中 的 使 用 
放 到 存储 单元 PACKED 中 。 需 要 注意 的 是 ，LSL、AND 和 OR 指令 会 影响 寄存 器 操作 数 的 所 
有 32 位， 但 我 们 所 需 的 打包 字 节 会 被 正确 地 生成 ， 并 存放 在 D1 的 最 低 8 位 中 。 





C.3.7 子 程 序 链接 指令 


ColdFire 提供 了 指令 和 处 理 器 堆栈 以 支持 子 程序 和 2.7 节 所 述 方式 的 参数 传递 。 地 址 寄存 
器 A7 作为 堆栈 指针 ， 它 必须 始终 有 一 个 值 ， 且 是 长 字 对 齐 的 ， 即 为 4 的 倍数 。 这 个 寄存 器 不 
用 于 任何 其 他 的 用 途 。 堆 栈 的 增长 方向 为 存储 器 地 址 降低 的 方向 。 寄 存 器 A7 中 的 堆栈 指针 值 
减 去 4 可 将 新 的 信息 压 人 栈 中 ,增加 4 便 可 从 栈 中 弹出 信息 。 

有 两 个 子 程序 调用 指令 BSR (branch-to-subroutine， 转 移 到 子 程序 ) 和 JSR (jump-to- 
subroutine， 跳 转 到 子 程序 )。BSR 指令 与 其 他 的 转移 指令 一 样 ， 可 用 8 位 、16 位 或 32 位 的 偏 移 
量 来 指定 子 程序 的 地 址 。JSR 指令 可 以 使 用 绝对 寻 址 、 间 接 寻 址 、 基 本 和 完全 变 址 寻 址 ， 或 者 
基本 和 完全 相对 寻 址 方式 来 产生 目标 地 址 。BSR 和 JSR 指令 都 会 自动 地 将 返回 地 址 压 人 处 理 
器 堆栈 中 ， 而 不 是 像 2.7 节 所 描述 的 那样 保存 在 一 个 链接 寄存 器 中 。 

在 子 程序 的 未 尾 ,RTS ( return-from-subroutine， 从 子 程 序 返 回 ) 指令 用 来 返回 到 调用 程序 。 
RTS 指令 从 栈 顶 弹出 返回 地 址 并 将 其 装 入 程序 计数 器 中 。 
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1. 参数 传递 

2.7.2 节 讨论 了 两 种 不 同 的 参数 传递 方法 ， 这 两 种 方法 通过 使 用 图 2-26 中 将 列表 中 数字 相 加 
的 示例 程序 进行 了 说 明 。 图 C-6 给 出 了 该 程序 的 ColdFire 版 本 ， 它 将 是 下 面 所 讨论 内 容 的 基础 。 

图 C-10 是 图 2-17 中 程序 ( 通过 寄存 器 传递 参数 ) 的 ColdFire 版 本 。 通 过 将 数值 列表 的 起 
始 地 址 放 到 寄存 器 A2 中 来 将 其 传递 给 子 程序 。 列 表 中 的 元 素 个 数 通 过 寄存 器 D1 传递 给 子 程 
序 。 在 将 列表 中 的 所 有 元 素 相 加 之 后 ， 子 程序 将 相 加 和 返回 到 寄存 器 D0 中 。 


MOVEA.L #NUMI1,A2 将 地 址 NUMI1 放 到 A2 中 
MOVEL NN,DI 将 列表 中 的 元 素 个 数 n 放 到 DI 中 
BSR LISTADD 调用 子 程序 LISTADD 

MOVE.L D0,SUM 将 和 保存 在 SUM 中 

下 一 条 指令 


子 程 序 


LISTADD: DO 

LOOP: (A2)+, DO ”将 和 累加 到 D0 中 
#1, D1 
LOOP 





图 C-10 将 图 C-6 中 的 程序 写成 一 个 子 程序 ;通过 寄存 器 传递 参数 


图 C-11 显示 了 图 2-18 中 程序 ( 通过 处 理 器 堆栈 传递 参数 ) 的 ColdFire 版 本 。 在 调用 子 程 
序 之 前 ， 列 表 的 起 始 地 址 和 元 素 个 数 被 压 入 栈 中 。 子 程序 会 从 栈 中 取出 这 些 值 。 子 程序 完成 
后 ， 将 返回 的 结果 放 到 堆栈 中 ， 以 供 调用 程序 取 回 。 


假设 栈 顶 初始 时 处 于 下 面 图 表 中 的 第 一 级 

调用 程序 
MOVEL #NUMI,-(A7) 将 参数 压 人 栈 中 
MOVEL NN,-(A7) 
BSR LISTADD 
MOVE.L 4(A7), DO 从 栈 中 获取 结果 
MOVE.L Do,SUM 保存 结果 
ADDA.L #8, A7 恢复 栈 顶 


子 程序 


LISTADD: ADDA.L  #-12,A7 调整 堆栈 指针 以 分 配 空间 
MOVEM.L D0-DI1/A2, (A7) ”保存 寄存 器 D0、D1 和 A2 
MOVE.L 16(A7), D1 将 计数 器 初始 化 为 n 
MOVEA.L 20(A7),A2 初始 化 指向 列表 的 指针 
GERL DO 将 和 初始 化 为 0 
ADD.L (A2)+, DO 加 上 列表 中 的 项 
SUBQL #1, D1 
BGT LOOP 
MOVE.L Do0,20(A7) 将 结果 放 到 栈 中 
MOVEM.L (A7), D0-D1/A2 ”恢复 寄存 器 
ADDA.L #12, A7 调整 堆栈 指针 以 释放 空间 
RTS 





a ) 调用 程序 和 子 程序 
图 C-11 将 图 C-6 中 的 程序 写成 一 个 子 程序 ; 通过 堆栈 传递 参数 
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b ) 堆栈 在 不 同时 刻 的 内 容 
图 C-11 ( 续 ) 


图 C-11 中 的 程序 也 说 明了 如 何 使 用 MOVEM (Move Multiple Registers， 移 动 多 个 寄存 器 ) 
指令 向 或 从 存储 器 中 的 连续 单元 保存 或 恢复 寄存 器 的 值 。MOVEM 指令 有 两 个 操作 数 ， 并且 
操作 数 的 顺序 决定 了 寄存 器 的 值 是 写 入 存储 器 还 是 从 存储 器 中 读 出 。 其 中 一 个 操作 数 是 单个 寄 
存 器 的 列表 或 者 是 寄存 器 范围 的 列表 ， 如 D0-DI/A2。 另 一 个 操作 数 是 存储 器 中 值 的 起 始 地 址 ， 
它 必须 通过 间接 寻 址 方式 或 基本 变 址 寻 址 方式 来 指定 。MOVEM 指令 从 给 定 的 起 始 单元 开始 
沿 着 地 址 增加 的 方向 来 读 写 存储 器 。 

在 子 程序 的 开头 ，ADDA.L 指令 将 图 C-11b 中 的 堆栈 指针 从 第 二 级 调整 到 第 三 级 。 这 为 保 
存 三 个 寄存 器 的 内 容 分 配 了 空间 。 然 后 MOVEM 指令 将 寄存 器 DO0、D1 和 A2 的 内 容 写 人 所 分 
配 的 空间 中 。 在 子 程序 的 末尾 ， 用 一 条 类 似 的 MOVEM 指令 从 栈 中 读 出 这 些 值 并 装 回 到 寄存 
器 中 ， 但 该 指令 的 源 / 目的 操作 数 的 顺序 是 相反 的 。 从 子 程序 返回 之 前 的 最 后 一 步 是 将 堆栈 指 
针 从 第 三 级 再 调整 到 第 二 级 ， 以 释放 之 前 为 保存 寄存 器 的 值 而 分 配 的 空间 。 

2. 用 于 子 程序 藤 套 的 栈 结构 

对 于 使 用 BSR 或 JSR 指令 的 和 能 套子 程序 调用 ， 每 次 调用 的 返回 地 址 都 被 自动 压 人 到 处 理 
器 栈 中 。 随 后 ， 当 散 套 序列 中 的 子 程序 完成 时 ， 就 会 执行 RTS 指令 。 每 条 RTS 指令 执行 时 ， 
会 从 栈 中 弹出 相应 的 返回 地 址 。 

正如 2.7.3 节 所 讨论 的 那样 ， 栈 结构 (stack frame ) 为 笛 套 序列 中 的 每 一 个 子 程序 在 存储 
器 中 提供 了 工作 空间 。 除 了 堆栈 指针 A7 外 ， 可 将 另 一 个 地 址 寄存 器 用 作 子 程序 内 的 结构 指针 
( frame pointer ) 来 确定 当前 的 栈 结构 。 

ColdFire 提供 了 两 条 特殊 的 指令 来 管理 栈 结构 。 指 令 

LINK Ai,#disp 
用 来 在 子 程序 的 开头 分 配 一 个 栈 结构 。 它 执行 以 下 操作 : 

1 ) 将 寄存 器 Ai 的 内 容 (结构 指针 ) 压 入 到 处 理 器 栈 中 

2 ) 将 堆栈 指针 A7 的 内 容 复 制 到 结构 指针 Ai 中 

3 ) 将 指定 的 位 移 值 加 到 堆栈 指针 A7 中 
位 移 值 是 一 个 负数 以 使 堆栈 增长 ， 来 为 子 程序 中 的 局 部 变量 分 配额 外 的 空间 。 这 些 变 量 可 通过 
使 用 寄存 器 Ai ( 结构 指针 ) 的 基本 变 址 或 完全 变 址 寻 址 方式 来 访问 。 位 移 量 还 可 以 用 来 为 保 
存 子 程序 所 使 用 的 寄存 器 值 分 配 空 间 。 

第 二 条 特殊 指令 

UNLK Ai 
用 来 在 子 程序 的 末尾 释放 栈 结构 。 它 与 LINK 指令 的 操作 相反 。 它 将 Ai 的 内 容 装 入 A7， 这 样 
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就 将 栈 顶 降低 到 其 原始 位 置 ， 即 其 加 上 位 移 值 之 前 的 位 置 。 然 后 ， 该 指令 从 栈 中 弹出 所 保存 的 


寄存 器 Ai 的 内 容 ， 并 将 其 放 回 到 Ai 中 。 


为 了 说 明 LINK 和 UNLK 指令 的 使 用 ,图 C-12 给 出 了 图 2-21 中 具有 医 套 子 程序 调用 的 
程序 的 ColdFire 代码 。 子 程序 SUB1 和 SUB2 的 栈 结构 如 图 C-13 所 示 。 执 行 流程 如 下 : 

e 调用 程序 将 参数 param2 和 paraml 压 人 栈 中 ， 以 供 子 程序 SUB1 使 用 。 当 通过 BSR 指 

令 调 用 SUB1 时 ， 返回 地 址 2014 被 压 人 栈 中 。SUB1 的 地 址 2100 与 BSR 指令 相隔 的 

距离 在 128 个 字 节 之 内 ， 因 此 ， 可 使 用 一 个 8 位 的 偏 移 量 ， 此 时 BSR 指令 只 需要 操作 


码 字 。 


e 子 程序 SUB1 从 一 条 分 配 栈 结构 的 指令 
LINK A6,#-16 


开始 ， 该 指令 将 A6 的 当前 值 保存 到 栈 中 ， 并 将 A7 的 值 写 入 A6 以 定义 新 的 结构 指 
针 ， 然 后 调整 A7 的 值 以 在 栈 中 分 配 足够 数量 的 空间 来 保存 SUB1 所 使 用 的 4 个 寄存 器 


的 值 。 


存储 单元 
调用 程序 


2000 
2006 
2012 
2014 
2020 
2024 


第 一 个 子 程序 


2100 SUB1: 
2104 


第 二 个 子 程序 


3000 SUB2: 


PARAM2, -(A7) 
PARAM1, -(A7) 
SUB1 

(A7), RESULT 
#8, A7 


A6, #-16 
D0-D2/A0,(A7) 
8(A6),A0 
12(A6), DO 


PARAM3, -(A7) 
SUB2 
(A7)+, D1 


D2, 8(A6) 
(A7), DO-D2/AO 
A6 


A6, #—8 
D0-D1,(A7) 
8(A6), DO 


Dl, 8(A6) 
(A7), D0-DI1 
Ab 


将 参数 放置 到 栈 中 


保存 结果 
恢复 栈 的 级 数 


设置 结构 指针 ， 分 配 栈 空 间 
保存 寄存 器 
载 人 参数 


将 一 个 参数 放置 到 栈 中 
将 SUB2 的 结果 弹出 到 D1 中 


将 结果 放置 到 栈 中 
恢复 寄存 器 
恢复 结构 指针 ， 
释放 栈 空 间 

返回 


设置 结构 指针 ， 分 配 栈 空间 
保存 寄存 器 
载 人 参数 


将 结果 放置 到 栈 中 
恢复 寄存 器 
恢复 结构 指针 ， 
释放 栈 空间 

返回 





图 C-12 要 套子 程序 
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e 使 用 MOVEM 指令 ,将 SUB1 所 使 用 的 4 个 寄存 器 的 当前 值 保 存在 栈 中 。 


。 然后 SUB1 使 用 结构 指针 及 基本 变 
址 寻 址 方式 来 从 酚 中 取出 paraml 


和 param2 的 值 。 执 行 一 些 计 算 后 ， 











SUB1 将 param3 压 入 栈 中 并 调用 子 A6 SUB2 的 栈 结构 
程序 SUB2， 返 回 地 址 2164 被 压 人 
栈 中 。 子 程序 SUB2 的 地 址 3000 与 
BSR 指令 相隔 的 距离 超过 128 字 节 ， 
因此 需要 在 指令 的 一 个 扩展 字 中 包 
含 一 个 16 位 的 偏 移 量 。 
e SUB2 以 它 自己 的 LINK 指令 开始 ， 
为 一 个 新 的 栈 结构 分 配 空间 ， 用 来 - SUB1 的 栈 结构 





A0 


[A6] from Main 
2014 






保存 寄存 器 值 。LINK 指令 之 后 是 







用 来 将 两 个 寄存 器 的 值 写 人 堆栈 
的 MOVEM 指令 。 然 后 从 楼 中 取出 DE 
param3 的 值 。 





e 执行 一 些 计算 后 ，SUB2 将 结果 放 人 原来 的 TOS 


| 
栈 中 ， 覆 盖 param3 的 值 。 两 个 已 保 
存 的 寄存 器 D0 和 DI 从 栈 中 恢复 ， 图 C-13 ”图 C-12 中 程序 的 栈 结构 
UNLK 指令 释放 当前 的 栈 结构 并 在 返回 到 SUB1 之 前 恢复 以 前 的 结构 指针 。 

e SUB1 在 返回 地 址 2164 处 恢复 执行 ， 从 栈 中 弹出 SUB2 的 结果 。SUB1 完成 其 计算 ， 并 
将 结果 放 入 栈 中 ， 和 覆盖 paraml 的 值 。4 个 已 保存 的 寄存 器 从 栈 中 恢复 ，UNLK 指令 为 
返回 到 调用 程序 做 准备 。 

e 主 程序 在 返回 地 址 2014 处 恢复 执行 ， 从 栈 中 取出 SUB1 的 结果 。 最 后 ，ADDA 指令 调 
整 寄 存 器 A7 的 值 ， 使 其 指向 最 初 的 栈 顶 元 素 ， 最 初 的 栈 顶 元 素 在 图 C-13 中 被 标记 为 
“原来 的 TOS”。 


C.4 汇编 指示 


2.5 节 讨 论 的 汇编 指示 ( assembler directive ) 可 以 用 于 ColdFire 程序 ， 只 是 在 标记 符号 上 
有 很 小 的 差别 。 飞 思 卡 尔 半导体 公司 提供 的 汇编 程序 要 求 每 个 指示 符 都 以 一 个 句号 开始 ， 以 区 
别 于 指令 助 记 符 。 
e ORG 指示 符 指定 了 指令 或 数据 块 的 起 始 地 址 。 
。 EQU 指示 符 将 名 字 与 数值 关联 起 来 。 
e DC (定义 常量 ) 指示 符 可 用 来 将 数据 常量 插入 到 目标 程序 中 。 在 一 个 DC 指示 符 中 可 
定义 多 个 数据 项 。 数 据 项 的 大 小 通过 后 级 L、W 或 B 指明 。 例 如 ,语句 
.ORG 100 
ITEMS: .DC.B 23, $4F, %10110101 
可 将 字 节 大 小 的 十 六 进 制 值 17 (23,o)、4F 和 B5 分 别 放置 到 存储 单元 100、101 和 102 中 。 
标签 ITEMS 被 赋予 值 100。 注 意 ,“$” 字 符 表示 十 六 进 制 值 , “%” 字 符 表示 二 进 制 值 。 
e DS (定义 存储 器 ) 指示 符 可 用 来 为 数据 保留 一 个 未 初始 化 的 存储 器 块 ， 用 后 级 来 表示 
数据 的 大 小 。 例 如 ， 语句 
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ARRAY: .DS.L 200 
保留 200 个 长 字 ， 并 将 标签 ARRAY 与 第 一 个 长 字 的 地 址 关联 起 来 。 
汇编 指示 符 的 使 用 如 图 C-14 所 示 ， 它 对 应 于 图 C-6 中 将 列表 数值 相 加 的 程序 。 


100 指令 从 地 址 100 处 开始 
#NUM1, A2 ”将 地 址 NUMI1 放 到 A2 中 
N, D1 将 列表 的 项 数 n 放 到 D1 中 
D0 

(A2)+, DO 将 和 累加 到 D0 中 

#1, D1 


LOOP 
D0, SUM 结束 时 保存 结果 


200 数据 从 地 址 200 处 开始 
为 相 加 和 保留 一 个 长 字 
列表 中 有 N=150 个 长 字 
为 150 个 长 字 保 留存 储 器 空间 





图 C-14 对 应 于 图 2-13 的 ColdFire 程序 


C.5 示例 程序 
在 本 节 中 ， 我 们 将 给 出 第 2 章 所 描述 的 点 积 程序 和 字符 串 搜索 程序 的 ColdFire 版 本 。 


C.5.1 向 量 点 积 程序 


图 2-28 中 的 程序 计算 两 个 向 量 AVEC 和 BVEC 的 点 积 。 该 程序 的 ColdFire 版 本 如 图 C-15 
所 示 。 我 们 假设 向 量 元 素 用 16 位 的 有 符号 字 来 表示 。MULS.W 指令 将 两 个 16 位 的 有 符号 数 
相 乘 并 产生 一 个 32 位 的 积 。 然 后 每 次 乘法 的 结果 会 被 累加 到 一 个 32 位 的 和 中 。 


#AVEC, Al 第 一 个 向 量 的 地 址 

#BVEC,A2 第 二 个 向 量 的 地 址 

N, D0 将 计数 器 的 值 设置 为 元 素 的 数量 
D1 D1 作为 计数 器 

(A1)+, D2 从 向 量 A 中 获取 元 素 


(A2)+, D2 乘 以 向 量 B 的 元 素 

D2, D1 累加 乘积 

#1, DO 递减 计数 器 

LOOP 如 果 计 数 器 大 于 0， 则 重复 此 过 程 
D1, DOTPROD ”结束 时 保存 结果 





图 C-15 计算 两 个 向 量 点 积 的 程序 


C.5.2 字符 串 搜 索 程 序 


图 2-31 中 的 程序 在 一 个 给 定 的 目标 字符 串 了 中 确定 第 一 个 与 模式 字符 串 己 相 匹 配 的 实 
例 。 该 程序 的 ColdFire 版 本 如 图 C-16 所 示 。 

回想 一 下 ，CMP 指令 被 限制 为 只 能 使 用 长 字 操作 数 。 因 此 ， 它 不 可 能 以 图 2-31 所 示 的 方 
式 用 一 条 指令 来 对 一 个 寄存 器 值 和 一 个 存储 器 操作 数 执行 字 节 大 小 的 比较 操作 。 而 必须 先 通过 
使 用 单独 的 MOVE.B 指令 将 两 个 要 比较 的 字符 放 到 寄存 器 DO 和 D1 中 ， 如 图 C-16 所 示 ， 然 
后 再 使 用 CMPL 指令 将 它们 进行 比较 。 因 为 MOVE.B 指令 只 影响 目的 寄存 器 的 低位 字 节 ， 所 
以 在 进入 主 循环 之 前 需要 将 寄存 器 DO 和 D1 中 的 所 有 32 位 清 零 ， 使 得 每 次 循环 中 的 比较 结果 
都 是 正确 的 。 


附录 CColdFire 处 理 器 ”+ 387 


MOVEA.L #T,A2 A2 指向 字符 串 了 
MOVEA.L #Pp,A3 A3 指向 字符 串 P 
MOVEA.L N,A4 获取 值 n 
MOVEA.L M,A5 获取 值 m 
SUBA.L A5, A4 计算 n-m 
ADDAL A2,A4 A4 是 Tln -m) 的 地 址 
ADDAL A3,A5 A5 是 P(m) 的 地 址 
DO 将 用 于 比较 的 数据 
D1 寄存 器 清 零 
A2, A0 用 A0 遍历 字符 串 了 
A3,Al 用 Al 遍历 字符 串 忆 
(AO)+, DO 比较 字符 串 了 
(A1)+, D1 和 PP 中 的 
D0, D1 一 对 字符 
NOMATCH 
Al,A5 检测 是 否 在 P(m) 中 
LOOP2 如 果 没 有 完成 再 次 循环 
A2, RESULT 保存 TD 的 地 址 
DONE 


NOMATCH: l #1, A2 指向 了 中 的 下 一 个 字符 
A2, A4 检查 是 否 在 Ttn 一 m) 中 
LOOP!1 如 果 没 有 完成 再 次 循环 
#-1,RESULT ”没有 找到 匹配 





图 C-16 字符 串 搜 索 程序 


C.6 ”操作 模式 和 其 他 控制 功能 


到 目前 为 止 ， 我 们 已 经 描述 了 指令 使 用 地 址 /数据 寄存 器 和 存储 器 中 的 操作 数 的 正常 执行 
过 程 。 我 们 还 介绍 了 一 些 实现 简单 计算 任务 的 程序 。 输 入 /输出 操作 和 其 他 任务 可 能 需要 额外 
的 功能 ( 如 中 断 ) 来 改变 正常 的 执行 行为 。 这 样 的 行为 可 以 通过 使 用 图 C-2 所 示 状 态 寄存 器 中 
的 某 些 位 来 控制 。 本 节 将 介绍 这 些 位 。 


S 位 可 从 两 种 可 能 的 操作 模式 中 选择 一 种 。 在 管 态 模式 (supervisor mode ) 下 ，S 
位 被 置 为 1， 处 理 器 可 以 执行 所 有 的 指令 并 访问 所 有 可 用 的 功能 ， 包 括 某 些 特权 
( privileged ) 功能 。 例 如 ， 将 状态 寄存 器 ( SR ) 作为 源 或 目的 操作 数 的 MOVE 指令 就 
是 一 条 特权 指令 ， 因 为 它 能 访问 S 位 和 其 他 控制 处 理 器 行为 的 位 。 处 理 器 复位 时 进入 
管 态 模式 。 系 统 软件 ( 包括 中 断 服 务 程序 ) 在 这 种 模式 下 执行 。 另 一 方面 ， 正 常 的 应 
用 程序 运行 在 用 户 模式 (user mode ) 下 。 在 这 种 模式 下 ，S 位 等 于 0， 这 将 阻止 应 用 程 
序 使 用 任何 特权 功能 。 从 用 户 模 式 到 管 态 模式 的 切换 只 能 在 进入 一 个 中 断 服务 程序 的 
时 候 发 生 。 而 从 管 态 模 式 到 用 户 模 式 的 切换 可 以 直接 通过 执行 一 条 修改 状态 寄存 器 的 
特权 指令 或 者 从 中 断 服务 程序 返回 来 完成 。 

bios 这 三 个 位 表示 人 处理 器 当前 的 中 断 优先 级 ( interrupt priority level )。 这 些 位 形成 了 中 
断 屏 蔽 码 (interrupt mask )， 它 的 值 在 0 和 7 之 间 。 给 各 种 中 断 源 分 配 不 同 的 优先 级 ( 1 
和 7 之 间 )。 中 断 屏蔽 码 的 设置 可 防止 处 理 器 响应 优先 级 等 于 或 低 于 当前 屏蔽 码 的 任何 
中 断 源 的 中 断 请 求 。 将 屏蔽 位 清 零 可 允许 所 有 的 中 断 ， 而 将 这 些 位置 为 7 则 可 禁止 所 
有 的 中 断 ， 除 了 处 于 第 7 级 的 不 可 屏蔽 的 (nonmaskable ) 中 断 请 求 。 这 种 基于 中 断 屏 
蔽 码 的 方法 与 3.2.1 节 所 讨论 的 方法 有 很 大 的 不 同 ， 那 一 节 中 图 3-7 所 示 的 状态 寄存 器 
用 单个 正 位 允许 所 有 的 中 断 。 

当 进 入 一 个 中 断 服务 程序 时 ，M 位 被 处 理 器 自动 清 零 。 这 个 功能 由 系统 软件 使 用 ， 而 
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与 一 般 的 应 用 程序 无 关 。 
。 位 用 于 调试 。 当 它 被 置 为 1 时 ， 每 条 指令 执行 后 就 会 触发 一 个 特殊 的 中 断 ， 以 允许 
系统 软件 跟踪 一 个 应 用 程序 的 执行 情况 。 
上 述 所 有 位 只 能 够 在 管 态 模式 下 进行 修改 。MOVE 指令 的 特权 版 本 允许 读 取 或 修改 状态 
寄存 器 中 的 所 有 位 。 而 在 用 户 模式 下 ，MOVE 指令 的 非特 权 版 本 只 允许 读 取 或 修改 状态 寄存 
器 中 的 条 件 码 标志 。 


C.7 输入 /输出 


第 3 章 通过 一 个 将 键盘 上 读 取 的 字符 进行 显示 的 例子 介绍 了 基于 轮 询 和 中 断 方式 的 IO 操 
作 。 现 在 我 们 使 用 该 例子 以 及 图 3-3 所 示 的 IO 接口 寄存 器 ， 来 介绍 ColdFire 指令 如 何 用 于 IO 
操作 。 

图 C-17 给 出 了 图 3-5 中 对 字符 的 输入 和 输出 都 使 用 轮 询 法 的 程序 的 ColdFire 版 本 。BTST.B 
指令 对 应 于 图 3-5 中 的 TestBit 指令 。 使 用 立即 操作 数 来 指定 BTSTB 指令 将 要 检测 的 位 限制 了 目 
的 操作 数 所 能 使 用 的 寻 址 方式 。 不 可 以 使 用 绝对 寻 址 方式 ， 因 此 图 C-17 中 的 程序 将 地 址 寄存 
器 A3 和 A4 初始 化 为 两 个 IO 接口 的 状态 寄存 器 的 地 址 ， 使 得 BTST.B 指令 可 以 使 用 间接 寻 址 
方式 。 此 外 ，CMP 指令 限制 为 只 能 使 用 长 字 操作 数 ， 因 此 在 执行 图 C-17 中 的 循环 之 前 ， 寄 存 
器 D0 被 清 为 零 。 每 个 字符 从 键盘 接口 读 到 寄存 器 D0 中 ， 以 便于 之 后 与 回 车 字符 CR 进行 比 
较 。 随 着 每 个 字符 从 寄存 器 D0 存储 到 存储 器 中 ， 寄 存 器 A2 中 的 指针 递增 。 


MOVEA.L #LOC,A2 初始 化 寄存 器 A2， 使 其 指向 主 存 
中 存储 字符 的 第 一 个 单元 的 地 址 


MOVEA.L #KBD_STATUS, A3 初始 化 寄存 器 A3， 使 其 指向 键盘 


状态 寄存 器 的 地 址 
MOVEA.L #DISP_STATUS, A4 初始 化 寄存 器 A4， 使 其 指向 显示 
器 状态 寄存 器 的 地 址 
CERL DO 将 用 来 保存 字符 的 数据 寄存 器 清 零 
: BTSTB #1, (A3) 等 待 一 个 字符 被 输入 到 键盘 缓冲 区 
BEQ READ 中 
MOVE.B KBD_DATA,DO 将 字符 从 KBD_DATA 中 读 取 到 寄 
存 器 D0 中 (这 将 KIN 清 为 0) 
MOVE.B D0,(A2+ 将 字符 传送 到 主 存 并 递增 指针 以 存 
储 下 一 个 字符 
: BTST.B #2, (A4) 等 待 显示 器 准备 就 绪 
BEQ ECHO 将 刚 读 人 的 字符 移 到 显示 器 缓冲 寄 
YE 存 器 中 (这 将 DOUT 清 为 0) 
，CMPIL #CR, DO 检查 刚 读 入 的 字符 是 否 为 CR ( 回 
车 符 )， 如 果 不 是 ， 则 转移 回去 读 取 
BNE READ 另 一 个 字符 














图 C-17 图 3-5 中 基于 轮 询 方式 程序 的 ColdFire 版 本 


为 了 说 明 IO 操作 中 如 何 使 用 中 断 ， 图 C-18 使 用 ColdFire 指令 实现 了 图 3-10 中 的 例子 。 
假设 图 C-18 所 示 主 程序 中 的 初始 化 代码 在 处 理 器 处 于 管 态 模 式 的 时 候 执 行 。 两 条 特权 MOVE 
指令 可 访问 状态 寄存 器 ( SR )。 使 用 这 两 条 指令 以 及 ANDI 指令 来 将 中 断 屏 蔽 位 清 0， 从 而 人 允 
许 所 有 的 中 断 。 由 于 我 们 希望 其 他 位 保持 不 变 ， 所 以 状态 寄存 器 的 当前 内 容 首 先 被 读 和 人 到 数据 
寄存 器 中 ， 然 后 只 有 与 中 断 优先 级 屏蔽 码 有 关 的 位 才 会 通过 ANDI 指令 清 为 0。 最 后 ， 将 修改 
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后 的 内 容 写 回 到 状态 寄存 器 中 。 


中 断 服务 程序 
ILOC: MOVE.L A2,-(A7) 保存 寄存 器 
MOVEL D0,-(A7) 
MOVEA.L PNTR, A2 从 存储 器 中 载 人 地 址 指针 
CLR.L D0 将 寄存 器 清 零 ， 以 保存 字符 
MOVE.B ”KBD_DATA, D0 从 键盘 读 入 字符 
D0, (A2)+ 写 和 从 二 并 吉 增 指 计 
A2, PNTR 修改 存储 器 中 的 指 
#DISP_STATUS, A2 将 A2 i 
#2, (A2) 等 待 显 示 器 准备 就 绪 
ECHO 
D0, DISP_DATA 显示 刚 读 人 的 字符 
检查 刚 读 入 的 字符 是 否 为 回 车 符 (CR ) 
如 果 不 是 CR 则 返回 
指示 行 的 结束 


#KBD_CONT, A2 将 A2 设 置 为 控制 寄存 器 的 地 址 
#1, (A2) 禁止 键盘 中 断 

(A7)+, DO 恢复 寄存 器 

(A7)+, A2 


从 中 断 返 回 


: MOVEA.L #LINE,AO 初始 化 缓冲 区 指针 
MOVE.L Ao0,PNTR 
CLRL EOL 清除 行 结束 指示 变量 
MOVEA.L #KBD_ CONT. A0 将 A0 Te 
BSETB #1, (AO) 允许 键 
MOVE.W SR,DO 入 和 计 丰 才 的 内 容 读 人 到 D0 中 
ANDIL #$F8FF, DO 清除 优先 级 屏蔽 码 ， 以 允许 中 断 
MOVE.W Do, SR 将 D0 的 值 写 人 到 状态 寄存 器 中 





图 C-18 图 3-10 中 基于 中 断 方式 程序 的 ColdFire 版 本 


C.8 浮 点 运算 


浮 点 运算 指令 包含 在 基本 ColdFire 指令 集 的 扩展 集中 [1]。 具 有 该 扩展 集 的 处 理 器 的 硬件 
实现 包含 一 个 单独 的 浮 点 部 件 ( floating-point unit，FPU ) 和 额外 的 寄存 器 。FPU 人 允许 浮 点 运 
算 与 其 他 指令 并 发 执行 。 本 节 对 ColdFire 的 浮 点 功能 进行 简要 概述 。 浮 点 数 的 表示 在 第 1 章 中 
进行 了 介绍 ， 浮 点 算术 运算 在 第 9 章 中 进行 了 讨论 。 

所 有 的 浮 点 运算 都 是 对 64 位 的 双 精 度数 进行 的 。 为 实现 这 个 目的 ， 在 FPU 中 提供 了 8 
个 64 位 的 浮 点 数据 寄存 器 FP0 到 FP7。FPU 还 有 额外 的 控制 和 状态 寄存 器 ( 详细 信息 请 查阅 
ColdFire 的 技术 文档 [1] )。 浮 点 状态 寄存 器 (FPSR ) 具有 诸如 N 和 Z 这 样 的 条 件 码 标志 以 及 
浮 点 运算 所 特有 的 额外 标志 ， 这 些 额 外 的 标志 受到 涉及 浮 点 数 的 数据 移动 、 算 术 和 比较 操作 的 
影响 。 

浮 点 寄存 器 总 是 保存 64 位 的 双 精 度数 。 存 储 器 可 能 包含 32 位 单 精度 或 64 位 双 精 度 表示 
的 数 。 当 涉及 大 量 的 浮 点 数据 但 并 不 需要 很 高 的 精度 时 ， 单 精度 表示 会 降低 存储 需求 。 在 执行 
算术 运算 之 前 ，FPU 会 自动 将 存储 器 中 的 任何 单 精度 操作 数 转换 为 双 精 度数 。 如 果 需 要 ， 在 将 
双 精 度数 传送 到 存储 器 时 ， 也 可 以 将 其 转换 为 单 精度 数 。 

FPU 也 可 以 在 整数 和 双 精 度 浮 点 表示 之 间 进 行 转换 ， 后 面 将 会 介绍 。 在 硬件 中 实现 该 功 
能 不 需要 软件 来 进行 转换 ， 所 以 可 减少 执行 时 间 和 代码 大 小 。 

基本 指令 集 的 浮 点 扩展 集 需 要 在 汇编 语言 中 进行 额外 的 大 小 说 明 。 浮 点 指令 使 用 后 缀 D 
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表示 双 精 度 操作 数 ， 后 级 S 表示 单 精 度 操作 数 。 


C.8.1 FMOVE 指令 
FMOVE 指令 在 存储 单元 和 浮 点 寄存 器 或 者 两 个 寄存 器 之 间 传 输 数 据 。 后 级 指定 了 操作 数 
的 大 小 ， 可 根据 需要 将 操作 数 转换 为 双 精 度 表示 或 者 从 双 精 度 表示 转换 为 其 他 的 表示 。 源 操作 
数 可 能 在 一 个 浮 点 寄存 器 ( FP0 ~ FP7 ) 或 者 数据 寄存 器 (D0 ~ D7 ) 中 ， 也 可 能 在 一 个 由 间 
接 、 自 增 、 自 减 、 基 本 变 址 或 基本 相对 寻 址 方式 指定 的 存储 单元 中 。 除 了 基本 相对 方式 不 可 使 
用 之 外 ， 目 的 操作 数 所 允许 使 用 的 寻 址 方式 跟 源 操作 数 是 相同 的 。 源 操作 数 或 目的 操作 数 必须 
有 一 个 在 浮 点 寄存 器 中 。 当 目的 操作 数 在 一 个 浮 点 寄存 器 中 时 ， 浮 点 状态 寄存 器 (FPSR ) 中 
的 标志 ， 如 N 和 Z， 会 受到 最 终 的 64 位 双 精 度 结 果 的 影响 。 当 目的 操作 数 在 一 个 数据 寄存 器 
(D0 ~ D7 ) 或 者 一 个 存储 单元 中 时 ，FPSR 是 不 会 受到 影响 的 。 
当 操 作 数 的 大 小 说 明 符 为 D 时 ，64 位 双 精 度 浮 点 数 将 不 加 修改 地 从 浮 点 寄存 器 传送 到 存 
储 器 或 从 存储 器 传送 到 浮 点 寄存 器 ， 或 者 在 两 个 浮 点 寄存 器 之 间 进 行 传送 。 例 如 ， 指 令 
FMOVE.D (A3),FP5 
将 双 精 度数 从 地 址 寄存 器 A3 所 指定 的 存储 单元 装 入 浮 点 寄存 器 FP5 中 。 同 样 ， 指 令 
FMOVE.D FP2, 16(A5) 
将 双 精 度数 从 寄存 器 FP2 存储 到 由 寄存 器 A5 的 值 加 上 16 所 给 出 的 存储 单元 中 。 指 令 
FMOVE.D FP3,FP4 
将 双 精 度数 从 FP3 传送 到 FP4 中 。 
当 为 FMOVE 指令 指定 任何 其 他 的 操作 数 大 小 后 缀 时 ， 都 会 将 要 传输 的 信息 自动 转换 为 
双 精 度 表示 或 者 从 双 精 度 表示 转换 为 其 他 的 表示 。 例 如 ， 指 令 
FMOVE.S FP1, (A4) 
将 寄存 器 FP1 中 的 64 位 双 精 度 浮 点 数 转换 成 32 位 的 单 精度 浮 点 数 ， 然 后 将 转换 后 的 数 写 入 
由 寄存 器 A4 的 值 给 出 的 存储 单元 中 - 指令 
FMOVE.L 16(A2), FP3 
使 用 变 址 寻 址 方式 从 存储 器 中 读 取 一 个 长 字 ， 并 将 这 个 32 位 的 整数 转换 为 64 位 的 双 精 度 浮 点 
数 ， 再 将 转换 后 的 数 放 到 寄存 器 FP3 中 。 指 令 
FMOVE.W FP7,D2 
将 寄存 器 FP7 中 的 64 位 双 精 度 浮 点 数 转换 为 16 位 的 整数 ， 然 后 再 将 转换 后 的 数 放 到 寄存 器 
D2 的 低位 中 。 显 然 ， 将 浮 点 表示 转换 为 整数 表示 时 ， 会 有 潜在 的 精度 损失 。 


C.8.2 浮 点 算术 指令 

对 浮 点 数 进行 算术 运算 的 基本 指令 有 FADD、FSUB、FMUL 和 FDIV。 在 所 有 的 这 些 指令 
中 ， 目 的 操作 数 都 必须 在 浮 点 数 寄存 器 中 。FPSR 中 的 条 件 码 标志 ， 如 N 和 Z， 会 受到 最 终 的 
64 位 双 精 度 结果 的 影响 。 源 操作 数 可 能 在 一 个 浮 点 寄存 器 或 数据 寄存 器 中 ， 也 可 能 在 一 个 由 
间接 、 自 增 、 自 减 、 基 本 变 址 或 基本 相对 寻 址 方式 所 指定 的 存储 单元 中 。 需 要 一 个 后 组 来 说 明 
源 操 作 数 的 格式 。 对 于 除了 D 以 外 的 其 他 任何 后 级 ， 在 执行 指定 的 算术 运算 之 前 ， 源 操作 数 
将 被 自动 转换 为 双 精 度 表 示 。 例 如 ， 指 令 

FADD.W (A2)+,FP6 
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从 地 址 寄存 器 A2 所 给 出 的 存储 单元 中 读 取 一 个 16 位 的 整数 ，A2 自动 递增 2， 并 将 这 个 16 位 
的 整数 转换 为 64 位 的 双 精 度 浮 点 数 ， 然 后 再 将 转换 后 的 数 与 寄存 器 FP6 中 的 数 相 加 。 


C.8.3 比较 和 转移 指令 

使 用 FCMP 指令 可 对 两 个 浮 点 数 进行 比较 。 比 较 的 结果 会 影响 FPSR 中 的 标志 ， 如 N 和 
Z， 之 后 这 些 标志 会 被 转移 指令 使 用 。FCMP 指令 的 日 的 操作 数 必须 在 浮 点 寄存 器 中 。 源 操作 
数 可 能 在 一 个 浮 点 寄存 器 或 数据 寄存 器 中 ， 也 可 能 在 一 个 由 间接 、 自 增 、 自 减 、 基 本 变 址 或 基 
本 相对 寻 址 方式 所 指定 的 存储 单元 中 。 必 须 用 一 个 后 级 来 指定 源 操作 数 的 大 小 并 根据 需要 将 源 
操作 数 转换 为 双 精 度 表示 。 例 如 ， 指 令 

FCMPS (Al), FP3 

读 取 由 寄存 器 Al 的 值 所 给 出 的 存储 单元 中 的 32 位 单 精 度 浮 点 数 ， 并 将 这 个 数 转换 为 64 位 双 
精度 表示 ， 然 后 再 将 寄存 器 FP3 中 的 值 减 去 转换 后 的 数 ， 并 根据 减法 运算 的 结果 设置 FPSR 中 
的 标志 。 寄 存 器 FP3 中 的 值 没有 被 修改 - 

浮 点 条 件 转移 指令 的 格式 为 

FBcc LABEL 

其 中 cc 指定 浮 点 条 件 码 。 可 为 ce 指定 诸如 EQ、NE、LT 和 GT 之 类 的 测试 ， 与 FPSR 中 条 件 
码 标志 的 不 同 组 合 相 对 应 。 对 于 条 件 为 真 时 的 转移 目标 ，FBcc 指令 会 在 执行 时 指定 一 个 相对 
于 PC 值 的 偏 移 量 。 根 据 FBcc 指令 到 转移 目标 的 距离 ， 偏 移 量 可 由 16 位 或 32 位 表示 。 

由 于 FADD 和 FSUB 之 类 的 浮 点 算术 指令 会 影响 FPSR 中 的 标志 ， 所 以 在 某 些 情况 下 可 
能 不 需要 在 FBcc 指令 之 前 加 一 条 FCMP 指令 。C.8.5 节 中 的 示例 程序 显示 了 一 条 浮 点 算术 指 
令 之 后 如 何 紧 跟 一 条 浮 点 转移 指令 。 


C.8.4 其 他 浮 点 指令 

FPU 还 支持 一 些 其 他 的 指令 ， 如 平方 根 (FSQRT )、 求 反 (FNEG ) 和 绝对 值 (FABS )。 
这 些 指令 可 以 指定 一 个 或 两 个 操作 数 。 对 于 单 操作 数 来 说 ， 它 必须 在 浮 点 寄存 器 中 。 对 于 双 操 
作 数 来 说 ， 目 的 位 置 必须 是 浮 点 寄存 器 ， 且 源 操作 数 的 有 效 寻 址 方式 与 基本 浮 点 算术 指令 中 的 
源 操作 数 寻 址 方式 相同 。FPSR 中 的 条 件 码 标志 会 受到 这 些 指令 中 每 一 条 指令 结果 的 影响 。 根 
据 指 令 助 记 符 后 面 的 格式 说 明 符 ， 可 按 需 要 对 源 操 作 数 进行 数字 转换 。 


C.8.5 浮 点 程序 示例 

图 C-19 给 出 了 一 个 示例 程序 。 假 设 有 两 个 点 (xo, yo) 和 (x, y1)， 该 程序 确定 经 过 这 两 个 点 
的 直线 的 斜率 m 及 其 在 y 轴 上 的 截 距 bp， 当 这 两 个 点 位 于 一 条 垂直 线 上 时 除外 。 

假定 两 点 的 坐标 xo。、yo、x1 和 yi 为 64 位 的 双 精 度 浮 点 数 ， 存 储 在 从 COORDS 单元 开始 
的 连续 存储 单元 中 。 该 程序 把 计算 得 到 的 斜率 和 截 距 作为 双 精 度数 放 在 存储 单元 SLOPE 和 
INTERCEPT 中 。 直 线 的 斜率 公式 为 m = (y1 一 yo) / Go 一 xo)， 因 此 ， 该 程序 在 执行 除法 运算 之 前 
必须 先 检查 分 母 是 否 为 零 。 当 分 母 为 零 时 ， 两 点 在 一 条 垂直 线 上。 该 程序 将 值 1 写 人 存储 器 中 
一 个 称 为 VERT_LINE 的 单独 变量 中 以 反映 这 种 情况 ， 并 指出 存储 单元 SLOPE 和 INTERCEPT 
中 的 值 是 无 效 的 ， 不 做 进一步 的 计算 。 和 否则 ， 该 程序 计算 出 斜率 值 ， 并 将 其 保存 到 存储 器 中 。 
对 于 有 效 的 斜率 ,程序 计 算出 截 距 = m - m -xo， 也 将 其 保存 到 存储 器 中 。 最 后 ， 程序 将 0 写 
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到 存储 单元 VERT_LINE 中 来 表明 斜率 和 截 距 是 有 效 的 。 


MOVEA.L #COORDS,A2 A2 指向 坐标 列表 

FMOVE.D (A2),FPO FP0 中 的 值 是 xo 

FMOVE.D 8(A2),FP!I FP1 中 的 值 是 yo 

FMOVE.D 16(A2), FP2 FP2 中 的 值 是 x， 

FMOVE.D 24(A2),FP3 FP3 中 的 值 是 nm 

FSUB.D FP0, FP2 让 XI 一 Xo， 可 能 会 设置 
FPSR 中 的 ZZ 标志 

FBEQ NO_SLOPE 如 果 分 母 为 0， 则 m 是 不 确定 的 

FSUB.D FP1, FP3 计算 一 mo 

FDIV.D FP2, FP3 计算 m= V1— yo) / (一 Xo) 

MOVEA.L #SLOPE,A2 A2 指向 存储 单元 SLOPE 

FMOVE.D FP3,(A2) 将 斜率 保存 到 存储 器 中 

FMUL.D FP3, FPO 计算 mxo 

FSUB.D FP!1, FPO 计算 b=y-m:xo 

MOVEA.L #INTERCEPT, A2 A2 指向 存储 单元 INTERCEPT 


FMOVE.D FP],(A2) 将 截 距 保存 到 存储 器 中 
MOVEQ.L #0,D0 表明 直线 不 是 垂直 的 
BRA DONE 
NO_SLOPE: MOVEQ.L #1,D0 表明 直线 是 垂直 的 
DONE: MOVEL DO,VERT_LINE 


图 C-19 计算 直线 斜率 与 截 距 的 浮 点 程序 





C.9 结束 语 


ColdFire 实现 了 一 个 CISC 风格 的 指令 集 ， 该 指令 集 在 其 许多 指令 中 合并 了 算术 /逻辑 运 
算 和 存储 器 访问 操作 。 这 种 方法 减少 了 完成 一 个 给 定 的 计算 任务 所 必须 执行 的 指令 数目 。 根 据 
所 要 执行 的 操作 的 复杂 性 和 产生 操作 数 有 效 地 址 所 需 的 信息 量 ， 指 令 被 编码 为 一 个 、 两 个 或 
三 个 16 位 的 存储 字 。 支 持 多 种 寻 址 方式 。 除 了 整数 指令 ，ColdFire 已 定义 了 一 个 浮 点 扩展 集 。 
整数 和 浮 点 数 表示 之 间 能 自动 进行 转换 ， 这 是 浮 点 扩展 集 的 一 个 功能 。 


C.10 ”问题 解析 


本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解决 这 样 的 问题 。 
ED 

问题 : 假设 有 一 个 ASCII 编码 的 字符 串 保存 在 存储 器 中 ， 起 始 地 址 为 STRING。 该 字符 串 以 回 车 符 
(CR ) 结束 。 写 一 个 ColdFire 程序 来 确定 该 字符 串 的 长 度 。 

解答 : 图 C-20 给 出 了 一 个 可 能 的 程序 。 字 符 串 中 的 每 个 字符 与 CR( ASCII 码 为 0D ) 进行 比较 , 计 
数 器 递增 ， 直 至 到 达 字 符 串 的 末尾 。 结 果 存 储 在 单元 LENGTH 中 。 


MOVEA.L #STRING,A2 A2 指向 字符 串 的 开始 
CLR.L D3 D3 是 计数 器 ， 被 清 为 0 
CLRL D5 D5 用 于 长 字 比 较 ， 被 清 为 0 
MOVE.B (A2)+,D5 获取 下 一 个 字符 并 递增 指针 
CMPI.L #$0D, D5 将 字符 与 CR 进行 比较 


BEQ DONE 如 果 匹 配 ， 则 结束 

ADDQ.L #1,D3 递增 计数 器 

BRA LOOP 如 果 没 有 结束 ， 则 循环 回 到 前 面 
MOVE.L ”D3,LENGTH ”将 计数 值 存放 到 存储 单元 LENGTH 中 


图 C-20 例 C.2 的 程序 
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例 C.3 

问题 : 我 们 希望 在 一 个 32 位 的 非 负 整数 列表 中 找 出 最 小 的 数 。 跟 该 问题 有 关 的 所 有 数据 的 存储 地 址 
从 (1000)i 开始 。 该 地 址 处 的 长 字 必 须 保 存 所 找到 的 最 小 数 。 地 址 (1004)i 处 的 下 一 个 长 字 包 含 列表 中 的 
项 数 n。 之 后 从 地 址 (1008)is 开始 的 个 长 字 包 含 列表 中 的 数 。 写 一 个 程序 ， 找 出 最 小 的 数 ， 并 包含 按照 
规定 组 织 数据 所 需 的 汇编 指示 ( assembler directive )。 

解答 : 图 C-21 中 的 程序 实现 了 所 需 的 任务 。 程 序 中 的 注释 解释 了 这 个 任务 如 何 执行 。 该 程序 假设 
中 过 1。 列 表 中 包含 了 一 些 样本 数字 。 


$1000 列表 起 始 地 址 

#LIST, A2 A2 指向 列表 的 开始 

4(A2), D3 D3 是 计数 器 ， 初 始 化 为 n 

A2, A4 调整 A4 的 值 后 ，A4 指向 第 一 个 数 
#8, A4 

(A4), D5 D5 保存 目前 为 止 所 找到 的 最 小 的 数 
#1, D3 递减 计数 器 

DONE 如 果 D3 为 0， 则 结束 

(A4)+, D6 获取 下 一 个 数 并 递增 指针 


D6, D5 将 下 一 个 数 与 目前 的 最 小 数 进行 比较 

LOOP 如 果 下 一 个 数 不 小 于 目前 的 最 小 数 ， 则 再 次 循环 
D6, D5 否则 ， 更 新 目前 的 最 小 数 

LOOP 再 次 循环 

D5, (A2) 将 最 小 的 数 保存 到 SMALL 中 


$1000 
1 所 找到 的 最 小 数 的 存储 空间 


党 列表 中 的 项 数 
4, 5, 3, 6, 1, 8, 2 ”列表 中 的 项 





图 C-21 例 C.3 的 程序 


例 C.4 
问题 : 写 一 个 ColdFire 程序 ， 将 一 个 n 位 十 进 制 整数 转换 成 二 进 制 数 。 如 果 数 字 是 通过 键盘 输入 的 ， 
那么 十 进 制 数 是 以 个 ASCII 编码 字符 的 形式 给 出 的 。 
解答 : 考虑 一 个 4 位 十 进 制 数 D， 由 数字 ddydido 表示 。 该 数 的 值 为 ((d; x 10+d) x 10+d) x 
10 + do。 该 数 的 这 种 表示 是 图 C-22 中 程序 所 使 用 转换 技术 的 基础 。 注 意 ， 每 个 ASCII 编码 字符 先 通 过 
ANDI 指令 转换 成 一 个 二 进 制 编码 的 十 进 制 (BCD ) 数字 ， 然 后 再 用 于 计算 。 


MOVEL NN,D2 D2 是 计数 器 ， 初 始 化 为 n 
MOVEA.L #DECIMAL,A3 A3 指向 ASCII 数字 
CLR.L D4 D4 用 来 保存 二 进 制 数 
MOVEQ.L #10,D6 D6 用 来 乘 以 10 


MOVEB (A3)t,D5 获取 下 一 个 ASCII 数字 并 递增 指针 
ANDILL #S$O0F, D5 产生 BCD 数字 


ADD.L DS5, D4 加 到 中 间 结 果 中 

SUBQL ~ #1,D2 递减 计数 器 

BEQ DONE 如 果 结 束 ， 则 退出 循环 
MULU.L D6,D4 乘 以 10 

BRA LOOP 如 果 未 完成 ， 则 循环 回 到 前 面 


MOVEL. ”DSBINARY 将 结果 存放 到 存储 单元 BINARY 中 





图 C-22 例 C.4 的 程序 
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例 C.5 

问题 : 考虑 一 个 二 维 数字 阵列 A(i, j)， 其 中 i= 0 到 n-1， 是 行 索 引 , j= 0 到 mw-1， 是 列 索引 。 该 阵 
列 按 行 存储 在 计算 机 的 存储 器 中 ， 每 行 元 素 占 用 m 个 连续 的 字 单 元 。 写 一 个 子 程序 ， 将 第 x 列 的 元 素 逐 
一 加 到 第 y 列 的 元 素 上 ， 和 元 素 ( sum element ) 放 在 第 y 列 上 。 索 引 值 x 和 yy 通过 寄存 器 D2 和 D3 传 
递 给 子 程序 。 参 数 n 和 m 通过 寄存 器 D4 和 D5 传递 给 子 程序 ， 元 素 A(0,0) 的 地 址 通过 寄存 器 A0 进行 
传递 。 

解答 : 图 C-23 给 出 了 一 个 可 能 的 程序 。 我 们 假定 值 x*、y、n 和 m 分 别 存放 在 存储 单元 X、Y、N 和 
M 中 。 此 外 ， 阵 列 中 的 元 素 存 储 在 从 单元 ARRAY 开始 的 连续 的 字 中 ，ARRAY 是 元 素 A(0,0) 的 地 址 。 
程序 中 的 注释 说 明了 每 条 指令 的 作用 。 


X, D2 载 人 值 x 

Y D3 载 和 值 y 

N, D4 载 人 值 n 

M, D5 载 人 值 m 
#ARRAY, A0 载 人 A(0,0) 的 地 址 
SUB 


Al, (A7) 保存 寄存 器 Al 的 内 容 

#2, D5 确定 一 列 中 连续 元 素 之 间 的 距离 ( 以 字 
节 为 单位 ) 

D2, D3 产生 y-x 的 值 

#2, D3 产生 4(y - x) 的 值 


#2, D2 产生 4x 的 值 

D2, A0 A0 指向 A(0x ) 

A0, Al 

D3, Al Al 指向 A(0y ) 

(A0), D2 获取 第 x 列 中 的 下 一 个 数 

(Al), D3 获取 第 y 列 中 的 下 一 个 数 

D3, D2 将 两 数 相 加 ， 并 保存 和 

D2, (Al) 

D5, A0 递增 第 x 列 的 指针 

D5, Al 递增 第 y 列 的 指针 

#1, D4 递减 行 计数 器 

LOOP 如 果 未 完成 ， 则 循环 回去 

(A7)+, Al 恢复 寄存 器 Al 的 内 容 
返回 到 调用 程序 





图 C-23 例 C.5 的 程序 


例 C.6 

问题 : 假设 存储 单元 BINARY 中 包含 一 个 32 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显 
示 设 备 上 将 这 些 位 显示 为 8 个 十 六 进 制 数字 。 写 一 个 程序 完成 这 个 任务 。 

解答 : 首先 ， 我 们 需要 将 这 个 32 位 的 模式 转化 为 用 ASCII 编码 字符 表示 的 十 六 进 制 数字 。 转 换 过 
程 可 以 通过 查 表 法 来 完成 。 必 须 构造 一 个 包含 16 项 的 表 ， 以 便于 为 每 一 个 十 六 进 制 数字 提供 其 ASCII 
码 。 然 后 ， 对 于 BINARY 中 该 模式 的 每 一 个 4 位 的 段 ， 都 可 以 在 表 中 查找 到 其 相应 的 字符 ， 并 将 这 些 字 
符 存 储 在 从 地 址 HEX 开始 的 连续 字 节 单元 中 。 最 后 ， 将 从 地 址 HEX 开始 的 这 8 个 字符 发 送 给 显示 器 。 
图 C-24 给 出 了 一 个 可 能 的 程序 。 因 为 ColdFire 不 包含 循环 移 位 指令 ， 所 以 我 们 使 用 4 对 LSL 和 ADDX 
指令 来 达到 将 一 个 寄存 器 中 的 值 循环 移动 4 位 的 效果 。 
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MOVE.L ”BINARY D2 载 人 该 二 进 制 数 

MOVEL #8,D3 D3 是 数字 计数 器 ， 被 设置 为 8 

MOVEA.L #HEX,A4 A4 指向 十 六 进 制 数 字 

MOVEA.L #TABLE,A6 A6 指向 ASCII 码 转换 表 

CLR.L DO D0 为 0; 用 于 下 面 的 循环 移 位 

LSL.L #1, D2 通过 使 用 X 标 志和 加 0 操作 (4 次 ) 将 高 

A 位 数字 循环 移 位 到 低位 位 置 上 

LSL.L #1, D2 

ADDX.L Do,D2 

LSL.L #1, D2 

ADDX.L D0,D2 

LSL.L #1, D2 

ADDX.L Do0,D2 

MOVE.L ‘D2,D5 将 当前 值 复制 到 另 一 个 寄存 器 中 

ANDI.L #$0F, D5 提取 下 一 个 数字 

MOVE.B (A6,D5), D6 获取 该 数字 的 ASCII 码 

MOVE.B Dé,(A4)+ 将 其 存储 在 HEX 缓冲 区 中 ， 并 递 
增 数 字 指 针 

SUBQ.L #1,D3 递减 数字 计数 器 

BGT LOOP 如 果 不 是 最 后 一 个 数字 ， 则 循环 回 到 前 面 

DISPLAY: MOVEQ.L #8,D3 
MOVEA.L #HEX,A4 
MOVEA.L #DISP_DATA,A2 
DLOOP: MOVE.L 4(A2),D5 通过 测试 DOUT 标志 来 检查 显示 器 

ANDI.L #4, D5 是 否 准 备 就 绪 

BEQ DLOOP 

MOVEB (A4)+,(A2) 获取 下 一 个 ASCI 字 符 ， 递 
增 字 符 指 针 ， 并 将 其 发 送 给 
显示 器 

SUBQ.L #1,D3 递减 计数 器 

DLOOP 循环 ， 直 到 所 有 的 字符 都 显示 完毕 


1000 
8 ASCII 编码 数字 的 存储 空间 
$30, $31, $32, $33 

834 $35 $36 $37 SCH 码 转换 表 

$38, $39, $41, $42 

$43, $44, $45, $46 





图 C-24 例 C.6 的 程序 


习题 

[E] C.1 写 一 个 程序 ， 计 算 表 达 式 SUM = 580 + 68 400 + 80 000。 

[E] C.2 写 一 个 程序 ， 计 算 表达 式 ANSWER =AxB+CxD。 

[M] C.3 写 一 个 程序 ， 在 一 个 含有 个 32 位 整数 的 列表 中 找 出 所 包含 的 负 整 数 的 个 数 ， 并 将 该 计数 保存 
在 单元 NEGNUM 中 。n 保存 在 存储 单元 N 中 ， 列 表 中 的 第 一 个 整数 保存 在 单元 NUMBERS 中 。 
在 程序 中 包含 必要 的 汇编 指示 ( assembler directive ) 和 一 个 样本 列表 ， 列 表 中 含有 6 个 数字 ， 其 
中 一 些 是 负数 。 

[E] C.4 为 图 C-8 中 的 程序 写 一 个 如 图 C-14 所 示 风 格 的 汇编 语言 程序 。 假 设 采 用 图 2-10 所 示 的 数据 
布局 。 

[M] C.5 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.10 中 的 问题 。 

[M] C.6 写 一 个 ColdFire 程序 来 解决 第 2 章 中 例 2.5 所 描述 的 问题 。 

[M] C.7 写 一 个 ColdFire 程序 来 解决 第 3 章 中 例 3.5 所 描述 的 问题 。 

[M] C.8 写 一 个 ColdFire 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 
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[M] C.9 假设 TABLE 的 地 址 是 0x10100， 写 一 个 ColdFire 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 

[M] C.10 写 一 个 程序 ， 在 视频 显示 器 的 一 行 上 以 十 六 进 制 形式 显示 主 存 中 10 个 字 节 的 内 容 。 该 字 节 串 
在 存储 器 中 的 起 始 位 置 是 LOC。 每 个 字 节 将 显示 为 两 个 十 六 进 制 字符 。 连 续 字 节 应 以 空格 
分 隔 。 

[M] C.11 假设 存储 单元 BINARY 中 包含 一 个 16 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显示 
设备 上 将 这 些 位 显示 为 0 和 1 组 成 的 字符 串 。 写 一 个 ColdFire 程序 完成 这 个 任务 。 

[M] C.12 使 用 图 3-17 中 的 七 段 显 示 器 和 图 3-14 中 的 定时 器 电路 ， 写 一 个 程序 ， 显 示 序 列 0、1、2、 
9、0、… 中 的 十 进 制 数字 ， 每 个 数字 显示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 100 MHz 的 
时 钟 驱动 的 。 

[M] C.13 使 用 两 个 图 3-17 所 示 的 七 段 显 示 器 和 图 3-14 所 示 的 定时 器 电路 ， 写 一 个 程序 ， 显 示 序 列 0、1、 
2、…、98、99、0、… 中 的 数 ， 每 个 数 显示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 100 MHz 
的 时 钟 驱动 的 。 

[M] C.14 写 一 个 程序 ， 计 算 实 时 时 钟 时 间 并 以 小 时 (0 ~ 23 ) 和 分 钟 (0 ~ 59 ) 的 形式 显示 时 间 。 显 示 
器 包括 4 个 图 3-17 所 示 的 七 段 显 示 设 备 。 还 有 一 个 具有 图 3-14 所 示 接 口 的 定时 器 电路 ， 其 计 
数 器 是 由 100 MHz 的 时 钟 驱动 的 。 

[M] C.15 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.23 中 的 问题 。 

[D] C.16 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.24 中 的 问题 。 

[M] C.17 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.25 中 的 问题 。 

[M] C.18 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.26 中 的 问题 。 

[D] C.19 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.27 中 的 问题 。 

[M] C.20 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.28 中 的 问题 。 

[M] C.21 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.29 中 的 问题 。 

[M] C.22 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.30 中 的 问题 。 

[M] C.23 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.31 中 的 问题 。 

[D] C.24 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.32 中 的 问题 。 

[D] C.25 写 一 个 ColdFire 程序 来 解决 第 2 章 的 习题 2.33 中 的 问题 。 

[D] C.26 写 一 个 ColdFire 程序 来 解决 第 3 章 的 习题 3.20 中 的 问题 。 

[D] C.27 写 一 个 ColdFire 程序 来 解决 第 3 章 的 习题 3.22 中 的 问题 。 

[D] C.28 写 一 个 ColdFire 程序 来 解决 第 3 章 的 习题 3.24 中 的 问题 。 

[D] C.29 写 一 个 ColdFire 程序 来 解决 第 3 章 的 习题 3.26 中 的 问题 。 

[D] C.30 当 0 科 zx 科 站 /2 时 ， 函 数 sin(x) 能 以 合理 的 精度 近似 为 x-x1/6+x/120=x(1-x(1/6 一 x(1/120)))。 
写 一 个 子 程序 SIN， 接 受 一 个 输入 参数 ， 表 示 浮 点 寄存 器 中 的 x， 并 使 用 上 述 只 涉及 x 和 :的 第 二 
个 表达 式 来 计算 sin(x) 的 近似 值 。 计 算 所 得 的 值 应 返回 到 浮 点 寄存 器 中 。 子 程序 使 用 的 任何 寄 
存 器 ,包括 浮 点 寄存 器 ， 都 应 根据 需要 进行 保存 和 恢复 。 
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附录 目标 

在 本 附录 中 ， 你 将 学 习 ARM 处 理 器 。 本 附录 主要 讨论 : 

e@ 指令 集体 系 结构 

e 输入 /输出 能 力 

e 对 众人 式 应 用 的 支持 

第 2 章 中 ， 我 们 介绍 了 指令 集 和 寻 址 方式 设计 中 使 用 的 基本 概念 。 第 3 章 讨 论 了 LO 操 
作 。 在 本 附录 中 ， 我 们 将 介绍 这 些 概念 如 何在 ARM 处 理 器 中 实现 ， 并 用 ARM 汇编 语言 展示 
第 2 章 和 第 3 章 中 给 出 的 一 般 程序 。 

ARM (Advanced RISC Machine ) 有 限 公司 设 计 出 了 一 个 RISC 风格 的 处 理 器 系列 。ARM 
公司 将 这 些 设计 和 一 些 软件 工具 授权 给 其 他 公司 ， 用 于 芯片 制造 以 及 系统 的 开发 和 仿真 。 
ARM 处 理 器 主要 用 于 低 功 耗 和 低 成 本 的 伐 人 式 应 用 ， 如 移动 电话 、 通 信 调 制 解 调 器 和 汽车 引 
擎 管理 系统 。 

所 有 的 ARM 处 理 器 共享 一 个 基本 的 机 器 指令 集 。 这 里 使 用 的 ISA 版 本 被 ARM 公司 称 为 
第 4 版 [1]。 后 来 的 版 本 中 增加 了 一 些 不 需要 在 本 附录 中 讨论 的 扩展 信息 。 不 过 ， 在 后 面 的 章 
节 中 我 们 将 简要 总 结 其 中 的 一 些 扩展 信息 。Furber 的 专著 [2] 是 ARM 处 理 器 及 其 设计 原理 的 
信息 来 源 。Hohl 的 专著 [3] 介绍 了 ARM 汇编 语言 。 


D.1 ARM 的 特点 


ARM 的 字 长 是 32 位， 存储器 是 按 字 节 编 址 的 ， 每 个 字 节 的 地 址 是 32 位 ， 处 理 器 中 寄存 
器 的 长 度 也 是 32 位 。 在 存储 器 和 处 理 器 寄存 器 之 间 传 送 数据 时 采用 三 种 操作 数 长 度 : 字 节 (8 
位 )、 半 字 (16 位 ) 和 字 (32 位 )。 字 和 半 字 的 地 址 必须 是 对 齐 的 ， 也 就 是 说 ， 它 们 必须 分 别 
是 4 和 2 的 倍数 。 支 持 小 端 和 大 端 两 种 编 址 方案 ， 由 一 条 与 处 理 器 相连 的 外 部 输入 控制 线 做 出 
选择 。 
在 大 多 数 情况 下 ，ARM ISA 反映 了 RISC 风格 的 体系 结构 ， 但 它 也 有 一 些 CISC 风格 的 
RISC 风格 方面 
e 所 有 指令 的 长 度 是 固定 的 ， 为 32 位。 
@ 只 有 Load 和 Store 指令 可 以 访问 存储 器 。 
e 所 有 的 算术 和 逻辑 指令 都 只 能 对 处 理 器 寄存 器 中 的 操作 数 进行 操作 。 
CISC 风格 方面 
e 提供 自 增 、 自 减 和 基于 PC 的 相对 寻 址 方式 。 
e 条 件 码 (N、Z、V 和 C ) 用 于 转移 和 指令 的 条 件 执行 ， 它 们 的 含义 已 在 2.10.2 节 中 作 
过 解释 。 
。 使 用 单一 一 条 指令 就 可 以 将 一 个 连续 的 存储 器 字 块 装 人 多 个 寄存 器 中 或 者 将 多 个 寄存 
器 的 内 容 存 储 在 一 个 块 中 。 
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ARM 体系 结构 的 特色 

ARM 体系 结构 具有 一 些 现 代 处 理 器 所 没有 的 特征 。 

1. 指令 的 条 件 执行 

ARM 处 理 器 的 一 个 特色 是 所 有 的 指令 都 是 有 条 件 地 执行 。 只 有 条 件 码 标志 的 当前 值 满足 
了 指令 的 一 个 4 位 字段 所 指定 的 条 件 时 指令 才 会 被 执行 。 否则， 处 理 器 将 处 理 下 一 条 指令 。 其 
中 有 一 个 条 件 用 来 指定 该 指令 总 是 被 执行 的 。 条 件 执行 的 优点 将 在 D.9 节 中 通过 例子 来 说 明 。 
现在 ， 我 们 暂时 忽略 这 个 特点 并 假定 该 指令 的 条 件 字段 指定 为 “总 是 被 执行 ”。 

2. 无 移 位 或 除法 指令 

指令 集中 没有 明确 地 提供 Shift ( 移 位 ) 指令 。 但 是 算术 、 逻 辑 或 Move (移动 ) 指令 中 的 
一 个 立即 值 或 一 个 寄存 器 操作 数 可 以 在 其 参与 操作 之 前 移 位 一 个 预定 的 量 ， 这 将 在 D.4.2 节 中 
进行 解释 。 此 功能 可 以 用 来 隐 含 地 实现 移 位 指令 。 

指令 集中 有 许多 不 同 的 乘法 指令 ， 并 可 以 进行 多 种 变化 以 用 于 信号 处 理应 用 中 。 但 是 没 
有 硬件 除法 指令 ， 除 法 运算 必须 用 软件 实现 。 


D.2 寄存 器 结构 

ARM 处 理 器 有 16 个 32 位 的 处 理 器 寄存 器 可 用 于 用 户 应 用 程序 ， 标 记 为 RO 到 R15， 如 
图 D-1 所 示 。 其 中 包含 15 个 通用 寄存 器 ( RO 到 R14 ) 和 一 个 程序 计数 器 ( PC )， 也 就 是 寄存 
器 R15。 通 用 寄存 器 中 可 以 保存 存储 器 地 址 或 者 数据 操作 数 。 寄 存 器 R13 和 R14 专门 用 于 处 
理 器 堆栈 和 子 程序 的 管理 中 。 这 将 在 D.4.8 节 中 进行 讨论 。 
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RI 1 在 
通用 
寄存 器 
R14 
31 0 
31 30 29 28 756 4 0 
CPSR | | | | | | | | | |， "| | 状态 寄存 器 

N- 负 人 区 
Z-0 处 理 器 模式 位 
C- 进位 中 断 禁止 位 1 和 下 


和 
条 件 码 标志 
图 D-1 ARM 的 寄存 器 结构 


当前 程序 状态 寄存 器 ( CPSR )， 或 简称 为 状态 寄存 器 ， 如 图 D-1 所 示 ， 保 存 条 件 码 标志 
(CN、Z、C、V)、 中 断 禁 止 位 和 处 理 器 模式 位 。 处 理 器 有 7 种 操作 模式 。 应 用 程序 运行 在 用 户 
模式 下 。 其 他 6 种 模式 用 于 处 理 IO 设备 中 断 、 处 理 器 上 电 / 复 位、 软件 中 断 和 存储 器 访问 冲 
突 。 处 理 器 模式 和 中 断 禁止 位 的 用 法 将 在 D.7 节 和 D.8 节 中 进行 描述 。 首 先 ， 我 们 假设 处 理 器 


附录 D ARM 处 理 器 :， 399 


在 用 户 模式 下 执行 一 个 应 用 程序 。 

此 外 ， 还 有 一 些 附加 的 通用 寄存 器 ， 称 为 后 备 寄 存 器 ( banked register )。 它 们 保存 的 是 
R0 到 R14 中 一 些 寄存 器 内 容 的 副本 。 当 处 理 器 从 用 户 模式 切换 到 其 他 的 操作 模式 时 ， 就 要 使 
用 不 同 的 后 备 寄存 器 。 使 用 后 备 寄存 器 可 避免 模式 转换 时 对 一 些 用 户 模式 寄存 器 的 内 容 进 行 保 
存 和 恢复 的 需要 -在 非 用 户 模式 下 状态 寄存 器 的 已 保存 副本 也 是 可 用 的 。 后 备 寄 存 器 以 及 状态 
寄存 器 的 副本 内 容 都 将 在 D.7 节 中 进行 讨论 。 


D.3 和 寻 址 方式 

2.4 节 中 讨论 的 立即 数 、 寄 存 器 、 绝 对 、 间 接 以 及 变 址 寻 址 方式 都 能 以 某 种 形式 用 于 
ARM 体系 结构 中 。 除 了 这 些 基本 方式 (通常 用 于 RISC 处 理 器 中 )，2.10.1 节 中 所 介绍 的 相对 
方式 以 及 自 增 和 自 减 方式 的 变 体形 式 也 有 提供 。 在 ARM 体系 结构 中 ， 很 多 寻 址 方式 都 来 自 于 
不 同形 式 的 变 址 寻 址 方式 。 


D.3.1 基本 变 址 寻 址 方式 

寻 址 存储 器 操作 数 的 基本 方法 是 变 址 寻 址 方式 ， 定 义 为 : 

预 变 址 方式 〈Pre-indexed mode ) 一 一 操作 数 的 有 效 地 址 是 基 址 寄存 器 Rn 的 内 容 和 一 个 有 
符号 的 偏 移 量 之 和 。 

我 们 将 使 用 Load 和 Store 指令 (分别 用 汇编 语言 助 记 符 LDR 和 STR 表示 ， 可 将 一 个 字 
从 存储 器 加 载 到 寄存 器 中 或 者 将 一 个 字 从 寄存 器 存储 到 存储 器 中 ) 来 说 明 变 址 寻 址 方式 如 何 运 
作 。 指 令 的 格式 如 图 D-2 所 示 。 在 所 有 的 ARM 指令 中 ， 高 4 位 指定 了 一 个 条 件 ， 这 个 条 件 决 
定 该 指令 是 否 执行 ， 如 D.1.1 节 所 描述 的 那样 。 偏 移 量 的 大 小 以 一 个 立即 值 的 形式 给 出 ， 包 含 
在 指令 的 低 12 位 中 , 或 者 以 另 一 个 寄存 器 Rm ( 在 指令 的 低 4 位 中 指定 ) 的 内 容 给 出 。 可 以 
用 操作 码 字段 中 的 一 个 位 来 区 分 这 两 种 情况 。 操 作 码 字段 中 的 另 一 个 位 可 指定 偏 移 量 的 符号 
(或 方向 )。 在 汇编 语言 中 ， 符 号 是 通过 偏 移 量 指 出 的 。 

3l 28 27 20 19 16 15 12 11 0 


条 人 昌 作 可 四 加 信和 二 或 者 BRm 


图 D-2 Load 和 Store 指令 的 格式 


Load 指令 
LDR Rd,[Rn, #offset] 

用 立即 数 方式 指定 偏 移 量 ( 表示 为 一 个 有 符号 数 )， 并 执行 操作 

Rd ~ [[Rn] + offset] 
指令 

LDR Ra, [Rn, Rml] 
执行 操作 

Rd < [[Rz] + [Rm]] 
由 于 Rm 的 内 容 是 偏 移 量 的 大 小 ， 所 以 ， 如 果 需 要 负 的 偏 移 量 ， 就 要 在 Rm 的 前 面 加 上 一 个 减 
号 。 请 注意 ， 在 ARM 汇编 语言 中 使 用 方 括号 而 不 是 括号 来 表示 间接 寻 址 。 预 变 址 寻 址 方式 的 
这 两 个 版 本 分 别 与 2.4.3 节 中 定义 的 变 址 寻 址 和 带 基 址 的 变 址 寻 址 方式 相同 。 
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如 果 偏 移 量 为 零 ， 则 不 必 在 汇编 语言 中 明确 指定 。 因 此 ， 指 令 
LDR Rud, [Rn] 
执行 操作 
Rd ~ [[Rn]] 
这 被 定义 为 2.4.2 节 中 的 间接 寻 址 方式 。 


D.3.2 ”相对 寻 址 方式 

在 预 变 址 寻 址 方式 中 ， 可 将 程序 计数 器 PC 用 作 基 址 寄存 器 Ra。 这 实际 上 就 是 2.10.1 节 
所 描述 的 相对 寻 址 方式 。 程 序 员 只 需 简单 地 将 所 需 的 地 址 标签 放 到 操作 数字 段 中 来 表明 这 种 方 
式 。 因 此 ， 指 令 

LDR RI]1,ITEM 

将 存储 单元 ITEM 中 的 内 容 装 入 寄存 器 R1 中 。 汇 编程 序 将 立即 数 偏 移 量 确定 为 操作 数 地 址 和 
更 新 后 的 PC 内 容 之 间 的 差 。 在 指令 执行 期 间 计算 有 效 地 址 的 时 候 ，PC 的 内 容 已 经 被 更 新 为 
从 包含 该 相对 寻 址 方式 的 指令 向 前 两 个 字 (8 个 字 节 ) 的 地 址 上 。 这 是 因为 在 指令 的 流水 线 执 
行 中 ARM 处 理 器 已 经 提取 了 下 一 条 指令 ,我 们 在 第 6 章 中 描述 了 指令 的 流水 线 执行 。 


D.3.3” 带 写 回 的 变 址 方式 


在 预 变 址 寻 址 方式 中 ， 寄 存 器 Rn 的 原始 内 容 在 产生 操作 数 有 效 地 址 的 过 程 中 没有 被 改 
变 。 这 种 方式 有 一 个 变 体 ， 称 为 带 写 回 ( writeback ) 的 预 变 址 方式 ， 在 这 种 方式 中 Rn 的 内 容 
会 被 改变 。 还 有 一 种 称 为 后 变 址 的 方式 ， 也 会 改变 寄存 器 Rn 的 内 容 。 这 些 方 式 分 别 是 2.10.1 
节 中 所 介绍 的 自 减 和 自 增 寻 址 方式 的 一 般 化 形式 。 它 们 被 定义 为 : 

带 写 回 的 预 变 址 方式 ( Pre-indexed with writeback mode ) 一 操作 数 有 效 地 址 的 产生 方法 与 
预 变 址 方式 相同 ， 然 后 有 效 地 址 要 被 写 回 到 寄存 器 Rn 中 。 

后 变 址 方式 ( post-indexed mode ) 一 操作 数 的 有 效 地 址 是 寄存 器 Rn 的 内 容 ， 然后 将 偏 移 
量 加 到 这 个 地 址 上 ， 并 将 结果 写 回 到 寄存 器 Rn 中 。 

表 D-1 说 明了 所 有 寻 址 方式 的 汇编 语言 语法 ， 并 给 出 了 计算 有 效 地 址 EA 的 表达 式 。 表 中 
还 显示 了 如 何 指定 写 回 操作 。 在 预 变 址 方式 中 ， 人 惊叹 号 字符 “! ”表示 要 进行 写 回 操作 。 后 变 
址 方式 始终 包含 写 回 操作 ， 所 以 不 需要 惊叹 号 字符 。 

从 表 D-1 中 可 以 看 出 ， 预 变 址 和 后 变 址 方式 的 区 别 在 于 使 用 方 括号 的 方式 。 当 方 括号 中 
只 有 基 址 寄存 器 时 ， 该 寄存 器 的 内 容 当 作 有 效 地 址 使 用 。 在 访问 完 操作 数 之 后 ， 将 偏 移 量 与 寄 
存 器 的 内 容 相 加 。 换 句 话 说， 这 是 后 变 址 方式 。 当 基 址 寄存 器 和 偏 移 量 都 放 在 方 括号 内 时 ， 两 
者 之 和 就 作为 操作 数 的 有 效 地 址 ， 也 就 是 说 这 使 用 的 是 预 变 址 方式 。 如 果 要 执行 写 回 操作 ， 就 
必须 通过 惊叹 号 字符 来 指示 。 


表 D-1 ARM 变 址 寻 址 方式 







带 有 立即 数 偏 移 量 


预 变 址 [Rn, #offset] 







EA= [Rn] + offset 

EA = [Rn] + offset; 
Rn 二 [Rn] + offset 
EA= [Rn]; 

Rn +— [Rn] + offset 


带 写 回 的 预 变 址 
后 变 址 


[Rn, #offset]! 
[Rn], #offset 
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( 续 ) 























Rnm 中 带 有 偏 移 量 值 
预 变 址 [Rn, + Rm, shift] EA = [Rn] + [Rm)] shifted 
带 写 回 的 预 变 址 [Rn, + Rm, shift]! EA = [Rn] + [Rm] shifted; 
Rn 二 [Rn] + [Rm] shifted 
后 变 址 [Rn], + Rm, shift EA = [Rn]; 
Rn 一 [Rn] + [Rm] shifted 
相对 寻 址 EA = Location 


Location 
EA= 有 效 地 址 
offset= 包含 在 指令 中 的 一 个 有 符号 数 
shift= 方向 # 整数 
这 里 方向 为 LSL 时 表示 左 移 ， 为 LSR 时 表示 右 移 ; 整数 是 一 个 5 位 的 无 符号 数 ， 用 来 说 明 移 位 的 量 
土 Rm= 寄存 器 Rm 中 的 偏 移 量 值 ， 可 以 与 基 址 寄存 器 Rn 的 内 容 相 加 或 者 从 基 址 寄存 器 Rn 的 内 容 中 减 去 


= [PC] + offset 





D.3.4” 偏 移 量 的 确定 


在 所 有 这 三 种 变 址 寻 址 方式 中 ， 可 以 将 偏 移 量 指定 为 土 4095 范围 内 的 一 个 立即 数 。 还 可 
以 通过 寄存 器 Rm 的 内 容 来 指定 偏 移 量 的 值 ， 偏 移 量 的 符号 (方向 ) 由 该 寄存 器 名 称 前 面 的 前 
级 “ 士 ”指定 。 例 如 ， 指 令 

LDR Ro0,[R1,-R2]! 
执行 操作 
RO © [[R1] - [R2]] 
由 于 指定 了 写 回 ， 所 以 操作 数 的 有 效 地 址 [R1] - [R2] 之 后 会 被 装 人 R1 中 。 

当 偏 移 量 在 寄存 器 中 给 出 时 ， 它 在 使 用 前 可 能 会 通过 右 移 或 左 移 缩放 2 的 宕 次 倍 。 在 汇 
编 语言 中 ， 这 可 以 通过 将 移 位 方向 (LSL 表示 左 移 ，LSR 表示 右 移 ) 和 移 位 量 放 在 寄存 器 的 名 
称 Rm 之 后 来 表示 ， 如 表 D-1 所 示 。 移 动 的 位 数 可 用 0 到 31 范围 内 的 一 个 立即 数 来 指定 。 移 
位 方向 和 移动 的 位 数 被 编码 在 指令 中 指定 Rm 的 同一 字段 中 ， 如 图 D-2 所 示 。 例 如 ， 上 例 中 
R2 的 内 容 在 作为 偏 移 量 使 用 之 前 可 能 要 乘 以 16， 可 将 指令 修改 如 下 : 

LDR RO0,[R1,—R2,LSL#4]! 
该 指令 执行 操作 
R0 二 [[R1] -16 x [R2]] 
由 于 指定 了 写 回 操作 ， 所 以 有 效 地 址 之 后 会 被 装 人 R1 中 。 


D.3.5 寄存 器 、 立 即 数 和 绝对 寻 址 方式 

寄存 器 寻 址 方式 是 在 算术 和 逻辑 指令 中 访问 操作 数 的 主要 方式 ， 这 将 在 D.4 节 中 进行 讨 
论 。 这 些 指令 中 也 可 以 使 用 常量 ， 它 们 以 8 位 立即 数 的 形式 提供 。 

如 果 预 变 址 方式 中 的 基 址 寄存 器 包含 值 0， 则 可 得 到 访问 存储 器 操作 数 的 绝对 寻 址 方式 的 
限制 形式 。 在 这 种 情况 下 ，12 位 的 偏 移 值 是 有 效 地 址 。 

这 里 所 描述 的 立即 数 寻 址 和 绝对 寻 址 方式 分 别 只 包含 8 位 和 12 位 的 值 。32 位 值 的 生成 及 
其 作为 立即 操作 数 或 存储 器 地 址 的 用 法 将 在 D.5.1 节 中 描述 。 
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D.3.6“ 寻 址 方式 示例 

图 D-3a 中 给 出 了 相对 寻 址 方式 的 一 个 例子 。 操 作 数 的 地 址 (在 指令 中 以 符号 ITEM 的 形 
式 给 出 ) 为 1060。 在 ARM 体系 结构 中 没有 绝对 寻 址 方式 ， 除 了 上 一 节 所 描述 的 绝对 方式 的 限 
制 形 式 。 因 此 ， 当 一 个 存储 单元 的 地 址 是 通过 将 一 个 地 址 标签 放置 在 操作 数字 段 中 来 指定 的 时 
候 ， 汇 编程 序 采用 相对 寻 址 方式 。 这 通过 带 有 一 个 立即 数 偏 移 量 、 使 用 PC 作为 基 址 寄存 器 的 
预 变 址 方式 实现 。 如 图 所 示 ， 汇 编程 序 计算 得 到 的 偏 移 量 是 52， 因 为 程序 执行 过 程 中 ， 当 偏 
移 量 加 到 更 新 后 的 PC 中 时 ，PC 中 包含 1008。 因 此 该 指令 所 产生 的 有 效 地 址 是 1060 = 1008 + 
52。 操作 数 必须 处 于 更 新 后 的 PC 之 前 或 之 后 4095 字 节 的 范围 内 。 如 果 操 作 数 的 地 址 超出 了 
这 个 范围 ， 那 么 汇编 程序 将 显示 错误 ， 并 使 用 其 他 的 寻 址 方式 来 访问 该 操作 数 。 

图 D-3b 给 出 的 是 一 个 预 变 址 方式 的 例子 ， 其 偏 移 量 放 在 寄存 器 R6 中 ， 基 址 值 放 在 R5 
中 。Store 指令 ( STR ) 将 R3 中 的 内 容 保存 到 存储 单元 1200 的 字 中 。 










字 (4 个 字 节 


a ) 相对 寻 址 方式 


存储 器 地 址 
1000 


1004 


1008 We [PC]=1008 


ITEM = 1060 






STR R3, [R5, R6] 


本 
上 
b ) 预 变 址 寻 址 方式 


图 D-3 存储 器 寻 址 方式 示例 


图 D-4 所 示 的 例子 说 明 在 了 后 变 址 和 预 变 址 寻 址 方式 中 写 回 功能 的 用 处 。 图 D-4a 显示 了 
一 个 包含 25 个 数 的 列表 中 的 前 三 个 数 ， 该 列表 在 存储 器 中 的 起 始 地 址 是 1000， 两 数 之 间 间 


8 下 偏 移 量 寄存 器 
00 = 


偏 移 量 






1200 
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隔 25 个 字 。 它 们 组 成 了 一 个 按 列 存 储 的 25 x 25 数字 矩阵 的 第 一 行 。 存 储 单元 1000、1004、 
1008、…、1096 包含 矩阵 的 第 一 列 。 和 矩阵 第 一 行 的 第 一 个 数 存储 在 字 单 元 1000 中 ， 第 一 行 中 
的 后 续 数 分 别 保存 在 地 址 1100、1200、…、3400 处 。 通 过 使 用 后 变 址 寻 址 方式 以 及 一 个 寄存 
器 中 的 偏 移 量 ， 可 以 方便 地 在 一 个 程序 循环 中 访问 矩阵 第 一 行 中 的 数 。 假 设 R2 用 作 基 址 
寄存 器 并 且 包 含 初始 地 址 值 1000。 同 时 假设 寄存 器 R10 用 来 保存 偏 移 量 ， 并 且 它 被 装 人 值 
25。 指 令 
LDR RI1,[R2], R10,LSL#2 

可 以 用 在 一 个 程序 循环 体 中 ， 在 连续 通过 循环 时 ， 将 矩阵 第 一 行 的 连续 元 素 装 人 寄存 器 
R1 中。 


1000 R2 
基 址 寄存 器 
偏 移 量 寄存 器 





2012 R5 


基 址 寄存 器 ( 栈 指针 ) 
2008 


2012 





b ) 带 写 回 的 预 变 址 寻 址 方式 
图 D-4 包含 写 回 的 存储 器 寻 址 方式 


下 面 让 我 们 一 步 一 步 地 分 析 它 是 如 何 工作 的 。 第 一 次 执行 Load 指令 时 ， 有 效 地 址 是 [R2] = 
1000。 因 此 ， 该 地 址 中 的 数 6 被 装 入 R1 中 。 然 后 ， 写 回 操作 将 R2 的 内 容 从 1000 改 为 1100， 
这 样 它 指向 第 二 个 数 -17。 这 是 通过 将 偏 移 寄存 器 R10 的 内 容 25 左 移 2 位 之 后 再 与 R2 的 内 容 
相 加 得 到 的 。 在 此 过 程 中 R10 的 内 容 不 会 改变 。 左 移 两 位 相当 于 将 25 乘 以 4， 产生 所 需 的 偏 
移 量 100。 在 第 二 遍 循环 中 执行 Load 指令 时 ， 第 二 个 数 -17 会 被 装 人 R1 中 。 第 三 个 数 321 在 
第 三 遍 循环 中 被 装 和 人 R1 中 ， 依 次 类 推 。 | 

本 例 中 包括 将 偏 移 量 寄存 器 中 的 内 容 进 行 移 位 并 与 基 址 寄存 器 中 的 内 容 相 加 的 操作 。 如 





404 : 附录 D ARM 处 理 器 


表 D-1 所 示 ， 移 位 后 的 偏 移 量 还 可 以 与 基 址 寄存 器 的 内 容 相 减 。 可 以 选择 的 移动 位 数 的 范围 是 
0 到 31， 并 可 以 指定 左 移 或 右 移 。 

图 D-4b 给 出 的 例子 将 寄存 器 R0 中 的 内 容 27 压 人 程序 员 定义 的 一 个 栈 中 。 寄 存 器 R5 用 
作 堆 栈 指 针 。 最 初 ， 它 包含 了 当前 TOS ( 栈 顶 ) 元 素 的 地 址 2012。 通 过 在 下 列 指令 中 使 用 带 
写 回 的 预 变 址 寻 址 方式 来 执行 Push 操作 

STR RO0,[R5,#—4]! 

立即 数 偏 移 量 - 4 与 R5 的 内 容 相 加 ， 并 且 将 新 的 值 写 回 到 R5 中 。 然 后 ， 这 个 新 栈 项 的 地 址 值 
2008 被 用 作 Store 操作 的 有 效 地 址 。 接 着 ， 寄 存 器 RO 的 内 容 被 存储 到 这 个 单元 中 。 


D.4 指令 


ARM 体系 结构 中 的 每 条 指令 都 被 编码 成 一 个 32 位 的 字 。 存 储 器 的 访问 只 能 通过 Load 和 
Store 指令 来 进行 。 所 有 的 算术 和 人 逻辑 指令 都 只 对 处 理 器 寄存 器 进行 操作 。 


D.4.1 Load 和 Store 指令 


在 上 一 节 关 于 寻 址 方式 的 介绍 中 ， 我 们 使 用 Load 和 Store 指令 在 存储 器 和 寄存 器 之 间 移 
动 单个 的 字 操 作 数 。 操 作 码 助 记 符 LDR 和 STR 用 于 这 些 指令 。 

存储 器 和 寄存 器 之 间 也 可 以 传送 字 节 和 半 字 的 值 。 如 果 操 作 数 是 一 个 字 节 ， 它 位 于 寄存 
器 的 低 字 节 位 置 中 。 如 果 操 作 数 是 一 个 半 字 ， 它 位 于 寄存 器 的 低 半 部 分 中 。 对 于 Load 指令 
来 说 ， 字 节 和 半 字 的 值 可 以 通过 使 用 指令 助 记 符 LDRB 和 LDRH 进行 零 扩展 或 者 通过 使 用 
LDRSB 和 LDRSH 进行 符号 扩展 得 到 32 位 的 寄存 器 长 度 。 字 节 和 半 字 Store 指令 的 助 记 符 是 
STRB 和 STRH。 

加 载 和 存储 多 个 操作 数 

有 两 条 指令 可 以 加 载 和 存储 多 个 操作 数 ， 它 们 被 称 为 块 传输 指令 。 这 类 指令 对 通用 寄存 
器 的 任意 子 集 都 可 以 进行 加 载 或 存储 。 但 是 只 允许 字 操 作 数 。 所 使 用 的 操作 码 为 LDM ( Load 
Multiple， 加 载 多 个 ) 和 STM ( Store Multiple， 存 储 多 个 )。 存 储 器 操作 数 必须 在 连续 的 字 单 元 
中 。 带 或 不 带 写 回 的 预 变 址 和 后 变 址 的 所 有 形式 都 是 可 用 的 。 它 们 对 指令 中 在 图 D-2 所 示 位 置 
上 指定 的 基地 址 寄存 器 Rn 进行 操作 。 这 些 指令 中 偏 移 量 的 值 始终 是 4， 所 以 不 需要 在 指令 中 
明确 地 指定 。 寄 存 器 列表 在 指令 的 汇编 语言 表示 中 必须 按 升序 出 现 ， 但 并 不 需要 是 连续 的 。 它 
们 可 在 编码 机 器 指令 的 位 bs- 中 指定 ， 如 果 寄 存 器 Ri 在 列表 中 ， 则 位 b;= 1。 

作为 一 个 例子 ， 假 设 寄 存 器 R10 是 基 址 寄存 器 ， 它 的 初始 值 为 1000。 指 令 

LDMIA R10!, {RO,R1, R6, R7} 

将 字 从 单元 1000、1004、1008 和 1012 传送 到 寄存 器 RO0、R1、R6 和 R7 中 ， 因 为 惊叹 号 字符 
指示 了 写 回 操作 ， 所 以 在 最 后 一 次 传输 之 后 ， 将 地 址 值 1016 放 在 R10 中 。 操 作 码 中 的 后 级 IA 
指示 “Increment After”， 对 应 于 后 变 址 。 我 们 将 在 D.4.8 节 的 子 程序 中 讨论 利用 Load/Store 多 
操作 数 指 令 来 保存 /恢复 寄存 器 的 值 。 


D.4.2 算术 指令 
ARM 指令 集中 有 很 多 可 对 操作 数 进 行 算术 运算 的 指令 ， 这 些 操作 数 可 以 在 通用 寄存 器 
中 ， 也 可 以 是 在 指令 中 给 出 的 立即 操作 数 。 这 些 指令 的 格式 与 图 D-2 所 示 的 Load 和 Store 指 
令 是 相同 的 ,但 第 二 个 源 操作 数 的 字段 标签 “ 偏 移 量 或 Rm” 要 替换 为 标签 “立即 数 或 Rm”。 
算术 指令 的 基本 汇编 语言 格式 是 
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OP Rd,Rn,Rm 
其 中 OP 码 ( 操作 码 ) 所 指定 的 操作 是 对 通用 寄存 器 Rn 和 Rm 中 的 源 操作 数 进行 的 。 结 果 保 
存在 目的 寄存 器 Rd 中 。 


1. 加 法 和 减法 
指令 
ADD RO, R2, R4 
执行 操作 
RO ©— [R2] + [R4] 
指令 
SUB RO0,R6,R5 
执行 操作 


RO «~ [R6] - [R5] 
第 二 个 源 操作 数 可 以 用 立即 数 方式 指定 。 例 如 ， 指 令 
ADD RO0,R3,#17 
执行 操作 
RO [R3]+17 
立即 操作 数 是 一 个 8 位 的 值 ， 保 存在 编码 机 器 指令 的 位 by。 中。 它 是 0 到 255 范围 内 的 一 个 无 
符号 数 。 汇 编 语言 允许 立即 操作 数 为 负 值 。 如 果 一 个 程序 中 使 用 了 指令 
ADD RO0,R3,#-17 
则 汇编 程序 会 将 其 替换 为 指令 
SUB RO0,R3,#17 

2. 第 二 个 源 操作 数 的 移 位 或 循环 移 位 

当 第 二 个 源 操 作 数 被 指定 为 一 个 寄存 器 的 内 容 时 ， 它 们 在 用 于 运算 之 前 可 以 被 移 位 或 循 
环 移 位 。 第 2 章 2.8.2 节 中 撒 述 的 逻辑 左 移 (LSL )、 逻 辑 右 移 (LSR )、 算 术 右 移 ( ASR ) 和 循 
环 右 移 (ROR ) 都 是 可 用 的 。 进 位 位 C 不 参与 这 些 运 算 。 移 位 或 循环 移 位 是 在 第 二 个 源 操 作 
数 的 寄存 器 名 之 后 指定 的 。 例 如 ， 指 令 

ADD RO0,RI1,R5,LSL#4 

的 执行 如 下 : 保存 在 寄存 器 Rs 中 的 第 二 个 源 操作 数 被 左 移 4 位 (等 价 于 [R5] x 16) 之 后 再 
与 寄存 器 RI1 的 内 容 相 加 。 将 和 保存 在 寄存 器 R0 中 。 移 位 或 循环 移 位 的 位 数 也 可 以 在 第 四 个 
寄存 器 中 指定 。 

如 果 第 二 个 源 操作 数 在 汇编 语言 指令 中 被 指定 为 0 到 255 范围 内 的 一 个 立即 值 ， 那 么 如 
上 所 述 ， 可 从 该 编码 的 机 器 指令 字 的 低 字 节 中 直接 获得 该 操作 数 。 对 程序 员 来 说 ， 还 可 以 指定 
一 部 分 32 位 值 。 它 们 可 在 指令 执行 时 通过 对 机 器 指令 低位 字 节 上 的 一 个 8 位 立即 值 按 以 下 方 
式 进行 操作 来 产生 : 该 8 位 的 值 首先 被 零 扩 展 为 32 位 ， 然 后 循环 右 移 偶数 位 来 产生 所 需 的 值 。 
8 位 的 值 和 循环 移 位 的 位 数 是 由 汇编 程序 根据 程序 员 所 指定 的 立即 值 来 决定 的 。 这 两 个 量 被 编 
码 到 指令 的 低 12 位 中 。 如 果 用 这 种 方式 不 能 产生 所 需 的 值 ， 将 会 报告 一 个 错误 ， 且 程序 员 必 
须 使 用 其 他 某 种 方式 来 产生 所 需 的 值 ， 如 D.5.1 节 所 描述 的 那样 。 

3. 多 字 操 作 数 

进位 标志 C 可 用 于 包含 多 字数 字 的 加 法 和 减法 运算 。 有 单独 的 指令 用 于 此 目的 ， 其 汇编 
语言 助 记 符 是 ADC (add with carry， 带 进位 的 加 法 ) 和 SBC ( subtract with carry， 带 进位 的 减 
法 )。 例 如 ， 假 设 要 将 两 个 64 位 的 操作 数 相 加 。 假 设 第 一 个 操作 数 包 含 在 寄存 器 对 R3 和 R2 
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中 ， 第 二 个 操作 数 包 含 在 寄存 器 对 Rs 和 R4 中 。 每 个 操作 数 的 高 位 字 包 含 在 较 高 编号 的 寄存 
器 中 。 可 通过 使 用 指令 
ADDS R6,R2,R4 
以 及 后 面 紧 跟 的 指令 
ADC  R7,R3, R5 
来 将 这 两 个 64 位 的 操作 数 相 加 ， 所 产生 的 64 位 和 包含 在 寄存 器 对 R7 和 R6 中 。ADDS 运算 
的 进位 输出 用 作 ADC 运算 中 的 进位 输入 ， 从 而 来 执行 64 位 的 加 法 。 需 要 使 用 ADD 指令 的 后 
级 S 来 设置 C 标志 。 
4. 乘法 
乘法 指令 有 两 个 基本 版 本 。 第 一 个 版 本 将 两 个 寄存 器 中 的 内 容 相 乘 ， 并 将 乘积 的 低 32 位 
保存 到 第 三 个 寄存 器 中 ， 乘 积 的 高 位 将 被 丢弃 。 如 果 操 作 数 是 补 码 表示 的 数 ， 并 且 它 们 的 乘积 
可 以 用 32 位 表示 ， 那 么 所 保留 的 低 32 位 乘积 就 表示 正确 的 结果 。 
例如 ， 指 令 
MUL RO0,R1,R2 
执行 操作 
RO <— [R1] x [R2] 
基本 乘法 指令 的 第 二 个 版 本 指定 了 第 四 个 寄存 器 ， 在 将 结果 保存 到 目的 寄存 器 之 前 ， 它 
的 内 容 与 乘积 相 加 。 因 此 ， 指 令 
MLA  R0, R1, R2, R3 
执行 操作 
RO <— ([R1] x [R2]) + [R3] 
这 被 称 为 “乘法 累加 ”操作 。 它 经 常用 于 信和 号 处 理应 用 中 。 
ARM 指令 集中 还 提供 了 可 以 产生 双 倍 字 长 (64 位 ) 乘积 的 乘法 和 乘法 累加 指令 。 对 于 有 
符号 和 无 符号 操作 数 ， 这 些 指令 还 有 不 同 的 版 本 。 
在 操作 数 用 于 乘法 运算 之 前 ， 并 没有 提供 对 其 进行 移 位 或 循环 移 位 的 指令 。 


D.4.3 ”Move 指令 


我 们 经 常 需 要 将 一 个 寄存 器 的 内 容 复制 到 另 一 个 寄存 器 中 ， 或 者 是 将 一 个 立即 值 装 入 一 
个 寄存 器 中 。Move ( 传送 ) 指令 
MOV Rd,Rm 
将 寄存 器 Rm 中 的 内 容 复 制 到 寄存 器 Rd 中 。 指 令 
MOV Rd,#value 
将 一 个 8 位 的 立即 值 装 入 目的 寄存 器 中 。 
Move 指令 的 第 二 个 版 本 ,被 称 为 “Move Negative”， 操 作 码 助 记 符 为 MVN， 对 源 操作 数 
按 位 求 补 ， 然 后 再 放 和 人 目的 寄存 器 中 。 回 想 一 下 ， 一 个 8 位 的 立即 值 是 0 到 255 范围 内 的 无 符 
号 数 。MVN 指令 可 以 按 如 下 方式 来 加 载 补 码 表示 的 负 值 。 假 设 我 们 希望 将 -5 装 人 寄存 器 RO0 
中 。 指 令 
MVN RO0,#4 
可 获得 所 需 的 结果 ， 因 为 4 的 位 补 是 -5 的 补 码 表示 。 通 常情 况 下 ， 为 了 将 - c 装 人 一 个 寄存 
器 中 ,我 们 可 以 使 用 MVN 指令 ， 以 及 一 个 立即 源 操作 数 c - 1。 为 方便 程序 员 ， 汇 编程 序 接受 
一 条 指令 ， 如 
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MOV RO0,#—5 
并 将 其 替换 为 指令 
MVN RO0,#4 

一 条 带 有 负 的 立即 源 操作 数 的 MOV 指令 是 伪 指 令 的 一 个 例子 。 汇 编程 序 将 其 蔡 换 为 一 条 
实际 的 机 器 指令 来 获得 所 需 的 结果 。 

像 D.4.2 节 所 描述 的 那样 ，Move 指令 中 的 源 操作 数 可 以 被 移 位 ， 然 后 再 写 和 人 目的 寄存 
器 中 。 

实现 移 位 和 循环 移 位 的 指令 

ARM 处 理 器 没有 显 式 的 指令 来 对 寄存 器 的 内 容 进 行 移 位 或 循环 移 位 ， 如 第 2 章 中 2.8.2 
节 所 述 。 但 是 ，Move 指令 中 对 源 寄 存 器 操作 数 进行 移 位 或 循环 移 位 的 能 力 提 供 了 相同 的 功能 。 
例如 ， 指 令 

MOV Ri Rj LSL 天 
可 达到 与 通用 指令 
LShiftL Ri, R7, #4 

相同 的 结果 ， 如 2.8.2 节 所 述 。 


D.4.4 ”逻辑 和 测试 指令 
逻辑 运算 AND (与 )、OR (或 ) XOR ( 蜡 或 ) 和 Bit-Clear ( 位 清除 ) 可 分 别 由 操作 码 为 
AND、ORR、EOR 和 BIC 的 指令 实现 。 这 些 指令 与 算术 指令 具有 相同 的 格式 。 指 令 
AND Rd,Rn,Rm 
对 寄存 器 Rn 和 Rm 中 的 操作 数 按 位 进行 逻辑 与 操作 ， 并 将 结果 放 到 寄存 器 Rd 中 。 例 如 ， 如 
果 寄 存 器 R0 包含 十 六 进 制 数 02FA62CA， 寄 存 器 R1 包含 0000FFFF， 那 么 指令 
AND R0,R0,RIl 
将 产生 结果 000062CA， 并 将 其 放 到 寄存 器 R0 中 。 
Bit Clear ( 位 清除 ) 指令 BIC 与 AND 指令 密切 相关 。 该 指令 首先 将 操作 数 Rm 按 位 求 反 
之 后 再 将 其 与 寄存 器 Rn 中 的 位 进行 与 操作 。 使 用 与 上 例 中 相同 的 RO 和 R1 位 模式 ， 指 令 
BIC RO0,RO0,RI 
将 结果 02FA0000 放 到 RO 中 。 
1. 数字 包 程 序 
图 D-5 在 一 个 ARM 程序 中 说 明了 逻辑 指令 的 使 用 ， 该 程序 将 两 个 4 位 的 十 进 制 数字 打包 
存放 在 一 个 存储 器 字 节 单元 中 。 这 个 程序 的 一 般 版 本 如 图 2-24 所 示 ， 并 在 2.8.2 节 中 进行 了 描 
述 。 用 ASCII 码 表示 的 十 进 制 数字 存储 在 字 节 单元 LOC 和 LOC+1 中 。 该 程序 将 相应 的 4 位 
BCD 码 打包 成 一 个 字 节 并 放 到 PACKED 中 。 
在 为 这 个 任务 编写 程序 时 ， 我 们 需要 将 一 个 32 位 的 地 址 装 和 人 一 个 寄存 器 中 。ARM 指令 
由 一 个 32 位 的 字 组 成 ， 所 以 不 能 在 Move 指令 中 使 用 立即 值 来 表示 地 址 。 
汇编 程序 接受 如 下 形式 的 指令 
LDR Ri,=ADDRESS 
它 将 地 址 值 ADDRESS 装 人 寄存 器 Ri 中 。 这 不 表示 一 条 实际 的 机 器 指令 ， 这 是 伪 指令 的 另 一 
个 例子 。 汇 编程 序 实 现 上 述 指令 的 方法 稍 后 将 在 D.5 节 中 进行 讨论 。 当 需要 将 一 个 地 址 值 装 人 
寄存 器 中 时 ， 我 们 通常 会 在 程序 示例 中 使 用 这 条 伪 指 令 。 
图 D-5 程序 中 的 第 一 条 指令 将 地 址 LOC 装 人 寄存 器 R0 中 。 接 下 来 的 两 条 Load 指令 分 
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别 将 两 个 ASCII 字符 (在 其 低 4 位 中 包含 BCD 数字 ) 装 人 寄存 器 R1 和 R2 的 低位 字 节 中 。 
AND 指令 将 R2 的 高 28 位 清 零 ， 将 第 二 个 BCD 数字 放 在 低 4 位 上 。 该 指令 中 的 “&” 字 符 
表示 立即 值 的 十 六 进 制 形式 。 然 后 ORR 指令 将 R1 中 的 第 一 个 BCD 数字 左 移 4 位， 并 将 其 
放 到 R2 中 第 二 个 BCD 数字 的 左边 。 然 后 ， 打 包 到 R2 低位 字 节 中 的 两 个 数字 被 存储 到 单元 
PACKED 中 。 


R0, =LOC 将 地 址 LOC 装 入 RO 

R1, [RO] 将 ASCII 字符 装 入 Rl1 和 R2 
R2, [RO, #1] 

R2, R2, #&F 将 R2 的 高 28 位 清 零 

R2, R2, R1, LSL 机 将 R1 的 内 容 左 移 之 后 ， 与 


R2 的 内 容 进 行 逻辑 或 运算 ， 
并 将 结果 保存 到 R2 中 


R2, PACKED 将 打包 的 BCD 数字 存 到 
PACKED 中 





图 D-5 将 两 个 4 位 的 十 进 制 数字 打包 到 一 个 字 节 中 的 程序 


2. Test ( 测试 ) 指令 
Test(TST ) 和 Test Equivalence ( TEQ ) 指令 分 别 对 字 操 作 数 执行 逻辑 AND 和 XOR 操作 ， 
然后 根据 结果 对 条 件 码 标志 进行 设置 。 这 些 指 令 不 在 寄存 器 中 保存 结果 。 它 们 可 以 用 来 测试 一 
个 未 知 的 位 模式 如 何 与 一 个 已 知 的 位 模式 相 匹配 ， 后 面 可 跟 一 条 Branch 指令 ， 其 转移 条 件 基 
于 这 些 测试 指令 的 结果 。 
例如 ，Test (测试 ) 指令 
TST Rn,#1 
执行 一 个 AND 操作 ， 以 测试 寄存 器 Rn 的 最 低位 是 否 等 于 1。 如 果 测 试 结果 是 正 的 ， 也 就 是 
说 ， 如 果 寄 存 器 Rn 中 内 容 的 最 低位 等 于 1， 那 么 AND 操作 的 结果 就 为 1， 且 Z 位 被 清 零 。 使 
用 这 种 类 型 的 指令 可 以 检查 IO 设备 寄存 器 中 的 状态 位 。 
Test Equivalence ( 测试 等 价 ) 指令 
TEQ Rn,#5 
执行 XOR 操作 来 测试 寄存 器 Rn 中 是 否 包 含 值 5。 如 果 Rn 中 包含 5， 那么 按 位 异 或 操作 的 结 
果 将 是 零 ， 是 Z 位 将 被 置 为 1。 


D.4.5 ”比较 指令 


Compare( 比较 ) 指令 
CMP Rn,Rm 
执行 操作 
[Rn] - [Rm] 
并 根据 减法 运算 的 结果 对 条 件 码 标 志 进 行 设置 ， 结 果 本 身 将 被 丢弃 。 
Compare Negative 指令 
CMN Rn,Rm 
执行 操作 
[Rn] + [Rm] 
并 根据 运算 的 结果 来 设置 条 件 码 标志 ， 运 算 的 结果 将 被 丢弃 。 


附录 D ARM 处 理 器 :， 409 


在 这 两 条 指令 中 ， 第 二 个 操作 数 还 可 以 是 一 个 立即 值 。 第 二 个 操作 数 的 任 一 版 本 都 可 以 
如 D.4.2 节 所 描述 的 那样 进行 移 位 。 


D.4.6 设置 条 件 码 标志 
Compare 和 Test 指令 总 是 会 修改 条 件 码 标志 。 它 们 后 面 通常 跟着 条 件 转移 指令 ， 条 件 转 

移 指令 将 在 下 一 节 描述 。 算 术 、 逻 辑 和 Move 指令 只 有 在 操作 码 字段 的 一 个 位 中 明确 说 明 要 修 
改 条 件 码 标志 时 ， 才 会 影响 条 件 码 标志 。 这 种 方式 通过 在 汇编 语言 操作 码 助 记 符 后 加 上 后 缀 S 
来 表示 。 例 如 ， 指 令 

ADDS  R0,R1L, R2 
是 要 设置 条 件 代 码 标志 的 ， 而 

ADD  R0, RI]1,R2 


就 不 设置 条 件 码 标志 。 
D.4.7 转移 指令 

条 件 转移 指令 包含 一 个 24 位 的 补 码 
值 ， 该 值 按 如 下 方式 生成 转移 偏 移 量 。 当 EQ LOCATION | 
执行 该 指令 时 ， 这 个 值 被 左 移 2 位 ( 因为 oo ed 
所 有 的 转移 目标 地 址 都 是 字 对 齐 的 )， 然 后 1004 


被 符号 扩展 为 32 位 ， 以 生成 偏 移 量 。 该 偏 更 新 后 的 [PC]= 1008 
移 量 与 程序 计数 器 的 更 新 内 容 相 加 以 生成 | 
转移 目标 地 址 。 在 图 D-6 中 给 出 了 一 个 例 ” 偏 移 量 =02 
子 。BEQ 指令 ( 如 果 等 于 0 就 转移 ) 在 2Z 
标志 被 置 为 1 时 便 会 产生 转移 。 汇 编程 序 LOCATION = 1100 
会 计算 出 指令 中 适当 的 24 位 值 。 在 本 例 
中 ， 它 是 92 /4= 23。 

对 其 进行 测试 以 确定 是 否 产 生 转 移 的 图 D-6 转移 指令 目标 地 址 的 确定 
条 件 是 在 指令 字 的 高 4 位 by_x 中 指定 的 。Branch ( 转移 ) 指令 与 其 他 的 ARM 指令 一 样 按照 
其 他 相同 的 方式 执行 ;也 就 是 说 ， 只 有 条 件 码 标志 的 当前 状态 与 相应 指令 的 条 件 字段 所 指定 的 
条 件 相 一 致 时 ， 才 会 产生 转移 。 表 D-2 给 出 了 所 有 的 条 件 。 汇 编程 序 接受 操作 码 B 作为 一 个 
无 条 件 转移 。 在 这 里 没有 必要 使 用 后 级 AL。 

表 D-2 ARM 指令 的 条 件 字 段 编码 





0111 无 溢出 V=0 


628 
? 
629 


630 
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( 续 ) 
ba1 *… bza 
io ZV NOW-0 
moi ZV WoW 
i | 未 使 用 


在 计算 转移 目标 地 址 的 同时 ， 由 于 指令 的 流水 线 执行 ，PC 的 内 容 已 经 被 更 新 为 Branch 指 
令 之 后 两 个 字 的 那 条 指令 的 地 址 ， 如 D.3.2 节 所 述 。 如 果 Branch 指令 的 地 址 是 1000， 且 转移 
目标 地 址 为 1100， 如 图 D-6 所 示 ， 那 么 由 于 在 计算 转移 目标 地 址 1100 时 ， 更 新 后 的 PC 内 容 
将 是 1000 + 8 = 1008， 所 以 偏 移 量 为 92。 

1. 用 于 数值 相 加 的 程序 





我 们 现在 已 经 描述 了 足够 多 的 RE 

ARM 指令 ， 使 我 们 能 够 介绍 第 2 章 R2. =NUMI De 装 人 R2 
训 ” 区 . 清空 累加 器 RO 

给 出 的 一 些 一 般 形式 的 程序 。 图 D-7 a i 
给 出 了 一 个 将 列表 中 的 数值 相 加 的 程 RO, RO, R3 二 人 

7 RI1, R1, #1 递减 循环 ; 
序 ， 它 模仿 图 2-26 中 的 程序 编写 。 单 LOOP 如 果 没 有 完成 ， 册 转移 回 到 前 面 
元 N 中 包含 列表 中 数据 的 个 数 ， 单 元 R0, SUM 保存 累加 和 
SUM 用 来 保存 相 加 的 和 。 第 一 条 和 
最 后 一 条 指令 使 用 相对 寻 址 方式 来 执 0 


行 Load 和 Store 操作 。 假 设 存储 单元 N 和 SUM 都 在 相对 于 PC 的 偏 移 量 所 能 达到 的 范围 内 。 
第 一 个 相 加 数 的 地 址 NUMI1 被 第 二 条 指令 装 人 寄存 器 R2 中 。 循 环 中 的 第 一 条 指令 使 用 了 带 写 
回 的 后 变 址 寻 址 方式 。 这 种 方式 可 达到 与 图 2-26 中 的 自 增 寻 址 方式 相同 的 效果 。 

2. 用 于 将 测验 成 绩 相 加 的 程序 

利用 ARM 变 址 寻 址 方式 的 灵活 性 可 以 为 图 2-11 所 示 的 将 学 生 测验 成 绩 相 加 的 程序 编写 
一 个 高 效 的 版 本 。 假 设 存储 器 中 的 数据 布局 与 图 2-10 所 示 的 相同 。 

图 D-8 给 出 了 该 程序 。 在 程序 的 开头 地 址 N 被 装 入 寄存 器 R2 中 。 寄 存 器 R2 用 作 后 变 址 
寻 址 方式 中 的 变 址 寄存 器 ， 用 来 访问 连续 学 生 记录 中 的 测验 成 绩 。 注 意 偏 移 量 8、4 以 及 4 连 
同 写 回 操作 是 如 何 使 得 寄存 器 R2 的 内 容 在 每 遍 循环 (包括 第 一 遍 循环 ) 时 都 能 正确 地 增加 ， 
以 跳 过 学 生 ID 单元 的 。 偏 移 值 的 灵活 性 和 写 回 功能 的 结合 意味 着 在 每 遍 循环 结束 时 不 需要 
图 2-11 程序 中 的 最 后 一 条 Add 指令 来 增加 指针 寄存 器 R2 的 值 。 


D.4.8 子 程序 链接 指令 
转移 与 链接 ( BL ) 指令 通常 用 来 调用 一 个 子 程序 。 它 的 操作 方式 与 其 他 转移 指令 的 操作 
方式 相同 ， 只 是 增加 了 一 步 ， 将 返回 地 址 ( BL 指令 的 下 一 条 指令 地 址 ) 装 人 寄存 器 R14 ( 它 
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实际 上 作为 链接 寄存 器 使 用 ) 中 。 由 于 子 程序 可 能 是 嵌 套 的 ， 所 以 链接 寄存 器 的 内 容 必须 在 舌 
套 调用 另 一 个 子 程序 之 前 保存 在 处 理 器 堆栈 中 。 寄 存 器 R13 通常 用 作 处 理 器 堆栈 的 指针 。 







LOOP 


R2, =N 将 地 址 N 装 入 R2 
MOV  R3,#0 
MOV  R4,#0 
MOV  R5,#0 
LDR  R6,N 加 载 n 值 


LDR ”R7,[R2,#8]! ”将 当前 学 生 的 测验 1 成 绩 加 到 部 分 和 上 
ADD  R3,R3,R7 

LDR ”R7,[R2,#4]! ”将 当前 学 生 的 测验 2 成绩 加 到 部 分 和 上 
ADD  R4,R4,R7 

LDR ”R7,[R2,#4]! ”将 当前 学 生 的 测验 3 成 绩 加 到 部 分 和 上 
ADD ~ R5,R5,R7 

SUBS R6,R6,#1l 递减 计数 器 

BGT LOOP 如 果 没 完成 就 循环 回 到 前 面 

STR R3,SUMI 保存 测验 1 的 总 和 

STR  R4,SUM2 保存 测验 2 的 总 和 





















R5, SUM3 保存 测验 3 的 总 和 








图 D-8 图 2-11 中 将 测验 成 绩 相 加 程序 的 ARM 版 本 


图 D-9 给 出 的 是 使 用 寄存 器 传递 参数 来 将 图 D-7 中 的 程序 重 写 为 一 个 子 程序 的 程序 。 调 
用 程序 利用 寄存 器 Rl1 和 R2 将 数值 列表 的 大 小 和 第 一 个 数 的 地 址 传送 给 子 程序 。 子 程序 利用 
寄存 器 R0 向 调用 程序 返回 计算 和 。 该 子 程序 还 用 到 了 寄存 器 R3。 因 此 ， 它 的 内 容 连 同 链接 寄 
存 器 R14 的 内 容 一 起 通过 使 用 STMFD 指令 保存 到 堆栈 中 。 该 指令 中 的 后 级 FD 说 明 堆 栈 是 向 
低地 址 方向 增长 的 ， 在 将 字 压 人 堆栈 之 前 ， 堆 栈 指针 R13 要 预先 递减 。LDMFD 指令 恢复 寄存 
器 R3 中 的 内 容 并 将 所 保存 的 返回 地 址 弹出 到 PC (R15 ) 中 ， 自 动 执行 返回 操作 。 


子 程序 
LISTADD 


LOOP 


STMFD 


MOV 
LDR 
ADD 
SUBS 
BGT 


RI,N 

R2, =NUMI 
LISTADD 
R0, SUM 


R13!, {R3, R14} 将 R3 和 R14 中 的 返回 地 址 保存 到 堆栈 中 ， 
R13 用 作 堆 栈 指针 


RO, #0 

R3, [R2], #4 
RO, RO, R3 
R1, R1, #1 
LOOP 


LDMFD R13!,{R3,R15} 恢复 R3 并 将 返回 地 址 装 人 PC ( R15 ) 中 





图 D-9 将 图 D-7 的 程序 编写 为 一 个 子 程序 ， 通 过 寄存 器 传递 参数 


图 D-10a 给 出 的 是 采用 处 理 器 堆栈 传递 参数 来 将 图 D-7 中 的 程序 重 写 为 一 个 子 程序 的 程 
序 ， 调 用 程序 的 前 四 条 指令 将 参数 NUM1 和 n 压 人 栈 中 。 子 程序 中 的 寄存 器 RO 和 R3 与 
图 D-7 中 的 用 途 相同 。 它 们 的 内 容 连 同 R14 中 的 返回 地 址 一 起 由 子 程序 中 的 第 一 条 指令 保存 
到 堆栈 中 。 图 D-10b 给 出 了 不 同时 刻 堆栈 中 的 内 容 。 在 参数 已 经 压 人 堆栈 并 且 执 行 完 调用 指令 
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( BL ) 之 后 ， 栈 顶 处 于 第 二 级 。 当 子 程序 中 的 第 一 条 指令 将 全 部 的 寄存 器 保存 完 之 后 ， 栈 项 处 
于 第 三 级 。 接 下 来 的 两 条 指令 利用 偏 移 量 20 和 24 来 访问 堆栈 中 的 参数 n 和 NUMI 并 将 其 分 
别 装 入 寄存 器 R1 和 R2 中 。 当 和 已 经 在 R0 中 累加 完 后 ， 由 Store 指令 (STR ) 将 其 写 入 到 栈 
中 ， 覆 盖 NUMI 的 内 容 。 


( 假设 栈 项 在 第 一 级 以 下 ) 
调用 程序 


R0, =NUMI 将 NUMI1 压 人 堆栈 中 

RO, [R13, #-4]! 

RO,N 将 4 压 人 堆栈 中 

RO, [R13, #-4]! 

LISTADD 

RO, [R13, #4] 将 和 移动 到 存储 单元 SUM 中 
RO, SUM 

R13, R13, #8 从 堆栈 中 移 除 参 数 


子 程序 


LISTADD R13!1, {RO-R3,R14} 保存 寄存 器 
R1, [R13, #20] 从 堆栈 中 载 人 参数 
R2, [R13, #24] 
RO, #0 
R3. [R2], #4 
RO, RO, R3 
RI1, R1, #1 
LOOP 
RO, [R13, #24] 将 和 放 人 堆栈 
LDMFD  R13!,{R0-R3,R15} 恢复 寄存 器 并 返回 





a ) 调用 程序 和 子 程序 


返回 地 址 


NUMI 





b ) 不 同时 刻 的 栈 顶 
图 D-10 将 图 D-7 的 程序 编写 为 一 个 子 程序 ， 通 过 堆栈 传递 参数 


子 程序 的 最 后 一 个 例子 是 对 找 套 调用 情况 的 处 理 。 图 D-11 给 出 了 图 2-21 中 程序 的 ARM 
代码 。 第 一 个 和 第 二 个 子 程序 对 应 的 堆栈 结构 如 图 D-12 所 示 。 寄 存 器 R12 用 作 结 构 指 针 。 为 
了 程序 的 可 读 性 ， 在 本 例 中 一 些 寄存 器 使 用 了 符号 名 称 。 寄 存 器 R12 ( 结构 指针 )、R13 ( 堆 
栈 指针 )、R14 ( 链接 寄存 器 ) 和 R15 ( 程序 计数 器 ) 被 分 别 标记 为 FP、SP、LR 和 PC。 汇 
编程 序 可 预定 义 LR 和 PC， 而 汇编 指示 符 RN 可 以 用 来 定义 名 称 FP 和 SP， 这 将 在 D.5 节 中 
进行 介绍 。 


第 一 个 子 程序 


2100 SUB1 
2104 
2108 
2112 


R10, PARAM2 
R10, [SP, #—4]! 
R10, PARAMI 
R10, [SP, #-4]! 
SUB1 

R10, [SP] 

R10, RESULT 
SP SP #8 


SP!, {RO—R3, FP, LR} 
FP, SP #16 

RO, [FP, #8] 

R1, [FP, #12] 


R2, PARAM3 
R2, [SP, #-4]! 
SUB2 

R2, [SP], #4 


R3, [FP, #8] 
SP!, {RO—R3, FP, PC} 


SP!, {RO, R1, FP, LR} 
FP, SP, #8 
RO, [FP, #8] 


R1, [FP, #8] 
LDMFD SP!, {RO, R1, FP, PC} 





图 D-11 
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将 参数 放 入 堆栈 


保存 SUB1 的 结果 
从 堆栈 中 移 除 参数 


保存 寄存 器 
载 人 结构 指针 
载 人 参数 


将 参数 放 人 堆栈 


将 SUB2 的 结果 弹出 放 人 R2 


将 结果 放 入 堆栈 
恢复 寄存 器 并 返回 


保存 寄存 器 
载 人 结构 指针 
载 人 参数 


将 结果 放 人 堆栈 
恢复 寄存 器 并 返回 


艇 套子 程序 
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调用 程序 和 子 程序 的 结构 与 图 2-21 相同 。ARM 的 特征 如 下 : 返回 地 址 和 结构 指针 中 原来 
的 内 容 由 每 个 子 程序 中 的 第 一 条 指令 保存 到 栈 中 。 第 二 条 指令 将 结构 指针 设置 成 指向 它 所 保存 
的 值 ， 如 图 D-12 所 示 。 这 是 与 图 2-20 和 图 2-22 中 的 结构 指针 位 置 相 一 致 的 。 于 是 ， 参 数 就 
可 以 在 偏 移 量 为 8 、12、… 处 进行 引用 了 。 每 个 子 程序 中 的 最 后 一 条 指令 都 用 来 恢复 结构 指针 
以 及 其 他 寄存 器 的 已 保存 值 ， 并 将 返回 地 址 从 堆栈 弹出 到 PC 中 。 


D.5 汇编 语言 


ARM 汇编 语言 利用 汇编 指示 ( assembler directive ) 来 保留 存储 空间 、 给 地 址 标号 和 常量 
符号 分 配 数值 、 定 义 程 序 和 数据 块 在 存储 器 中 的 放置 位 置 ， 以 及 指明 源 程 序 文本 的 结束 位 置 。 
这 些 汇 编 指 示 的 一 般 形 式 在 2.5.1 节 中 已 经 描述 过 了 。 
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[RO] from SUB1 

[R1] from SUB1 SUB2 

[FP] from SUB1 的 结构 
指针 

[RO] from Main 

[R1] from Main 


| 


[R2] from Main SUBI 
m 一 i 


一 一 原来 的 TOS 





图 D-12 图 D-11 的 栈 结构 


图 D-13 通过 给 出 图 D-7 中 程序 的 一 个 完整 源 程序 来 列举 一 些 ARM 的 汇编 指示 。AREA 
指示 符 使 用 参数 CODE 或 DATA 来 表示 包含 程序 指令 或 数据 的 存储 器 块 的 开始 。 还 需要 其 他 
的 参数 来 说 明代 码 和 数据 块 在 特定 存储 区 域 中 的 放置 位 置 。ENTRY 指示 符 说 明 程序 的 执行 是 
从 后 面 的 LDR 指令 开始 的 。 


存储 器 寻 址 或 
地 址 标号 操作 数据 信息 


AREA CODE 
ENTRY 


LDR RI1,N 

LDR R2, POINTER 
MOV RO, #0 

LDR R3, [R2], #4 
ADD RO, RO, R3 
SUBS RI1, R1, #1 
BGT LOOP 

STR R0, SUM 


汇编 指示 AREA DATA 
SUM DCD 0 
N DCD 5 
POINTER DCD NUMI 
NUMI DCD 3, 217,27, =12, 322 
END 





D-13 图 D-7 中 程序 的 汇编 语言 源 程序 


在 紧 跟 代码 区 之 后 的 数据 区 中 ，DCD 指示 符 用 来 标记 和 初始 化 数据 操作 数 。 字 单元 SUM 
和 NN 被 前 两 个 DCD 指示 符 分 别 初始 化 为 0 和 5。 地 址 NUMI1 被 下 一 个 DCD 指示 符 放 到 单元 


附录 D ARM 处 理 器 . 415 


POINTER 中 。 指 令 
LDR R2, POINTER 
和 数据 声明 
POINTER DCD NUMI 
的 组 合 是 实现 图 D-7 中 伪 指 令 
LDR R2,=NUMI! 
的 一 种 方式 ， 如 D.5.1 节 所 述 。 最 后 的 DCD 指示 符 指 明 要 相 加 的 五 个 数 将 被 放 到 从 NUMI 开 
始 的 连续 存储 字 单 元 中 。 
以 十 六 进 制 记 数 法 表示 的 常量 由 前 级 “&” 指 定 ， 以 基数 n(n 在 2 和 9 之 间 ) 表示 的 常 
量 由 一 个 表明 基数 的 前 缀 指定 。 例 如 ，2_101100 表示 一 个 二 进 制 常 量 ，8_70375 表示 一 个 八 进 
制 常量 。 基 数 是 10 的 常量 不 需要 前 级 。 
EQU 指示 符 可 用 来 声明 常量 的 符号 名 称 。 例 如 ， 语 句 
TEN EQU 10 
允许 TEN 代替 十 进 制 常 量 10 在 程序 中 使 用 。 
使 用 与 寄存 器 的 用 途 相 关 的 符号 名 称 是 非常 方便 的 。RN 指示 符 就 是 为 此 目的 而 设置 的 。 
例如 
COUNTER RN 3 
为 寄存 器 R3 建立 了 名 称 COUNTER。 寄 存 器 名 称 RO 到 R15、PC (R15 ) 以 及 LR (R14) 都 
是 由 汇编 程序 预定 义 的 。 


伪 指 令 

伪 指 令 (pseudoinstruction ) 是 汇编 语言 指令 ， 它 执行 一 些 所 需 的 操作 ， 但 并 不 直接 对 应 
于 真正 的 机 器 指令 。 汇 编程 序 接受 这 样 的 指令 ， 并 将 其 替换 为 执行 所 需 操 作 的 真正 的 机 器 指 
令 。 在 某 些 情况 下 ， 可 能 需要 一 个 真正 机 器 指令 的 短 序 列 。 但 伪 指令 为 程序 员 提供 了 方便 。 

我 们 已 经 在 D.4.3 节 和 D.4.4 节 中 看 到 了 伪 指令 的 例子 。 在 这 里 ， 我 们 将 对 伪 指令 进行 更 
完整 地 讨论 ， 可 使 用 伪 指 令 将 一 个 32 位 的 数值 或 地 址 值 装 人 一 个 寄存 器 中 。 

1. 加 载 32 位 值 

伪 指 令 

LDR Rd,=value 

可 用 来 将 任何 一 个 32 位 值 装 入 寄存 器 中 。 值 前 面 的 等 号 可 将 该 指令 与 真正 的 Load 指令 区 别 开 
来 。 如 果 该 值 能 由 一 条 MOYV 或 者 MVN 指令 形成 并 装 人 Rd 中 ， 那 么 汇编 程序 就 会 选择 这 么 
做 。 如 果 这 是 不 可 能 的 ， 那 么 汇编 程序 将 在 真正 的 LDR 指令 中 使 用 相对 寻 址 方式 来 从 一 个 存 
储 单元 中 加 载 该 值 ， 该 存储 单元 在 汇编 程序 所 分 配 的 数据 区 中 。 


例如 ， 指 令 
LDR R3,=127 
将 被 蔡 换 为 指令 
MOV R3,#127 
但 指令 
LDR R3,=&A123B456 
将 被 替换 为 


LDR R3,MEMLOC 
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其 中 十 六 进 制 值 A123B456 是 存储 单元 MEMLOC 的 内 容 ， 通 过 相对 寻 址 方式 来 访问 。 
地 址 标号 的 值 也 可 以 用 这 种 方式 加 载 到 寄存 器 中 ， 就 像 我 们 在 本 附录 的 大 部 分 程序 示例 
中 所 做 的 那样 。 
2. 加 载 地 址 值 
除了 刚刚 所 描述 的 方法 ， 当 一 个 地 址 接近 程序 计数 器 PC ( R15 ) 中 的 当前 值 时 ， 还 有 一 
种 更 有 效 的 方法 可 用 来 将 该 地 址 装 和 一 个 寄存 器 中 。 这 种 方法 避免 了 将 所 需 的 地 址 值 放 到 数据 
区 中 的 需要 。 
伪 指 令 
ADR Rd,LOCATION 
将 LOCATION 所 表示 的 32 位 地 址 装 入 Rd 中 。ADR 指令 的 执行 如 下 : 汇编 程序 计算 从 PC 
的 当前 值 到 LOCATION 的 偏 移 量 。 如 果 LOCATION 是 在 前 方 ， 那 么 ADR 将 由 下 列 的 指令 
实现 : 
ADD Ra, R15,#offset 
如 果 LOCATION 是 在 后 方 ， 那 么 将 使 用 指令 
SUB Ra,R15,#offset 
来 实现 ADR 伪 指 令 。 
在 这 两 种 情况 下 ， 偏 移 量 都 是 0 到 255 范围 内 的 一 个 8 位 无 符号 数 ， 就 像 前 面 介绍 算 
术 指 令 时 所 描述 的 那样 。 通 过 对 一 个 8 位 的 值 进行 循环 移 位 可 产生 某 些 较 大 的 偏 移 值 ， 就 像 
D.4.2 节 所 描述 的 那样 。 


D.6 示例 程序 
在 本 节 中 ， 我们 将 给 出 2.12 节 介 绍 过 的 向 量 点 积 程序 和 字符 串 搜 索 程序 的 ARM 版 本 。 


我 们 将 只 描述 ARM 代码 与 通用 程序 不 同 的 部 分 。 
D.6.1 向 量 点 积 程序 
图 D-14 给 出 了 一 个 计算 A 和 R1,=AVEC ”Rl 指向 向 量 A 
B 这 两 个 向 量 的 点 积 的 程序 。 前 两 Bi 
条 指令 将 这 两 个 向 量 的 起 始 地 址 人 RO 累加 点 积 
AVEC 和 BVEC 装 人 寄存 器 RI 和 Re 
R2 中 。 这 里 使 用 相对 寻 址 方式 来 R0, R4, R5, RO ”A、B 元 素 相 乘 ， 结 果 累 加 到 R0 中 
访问 N 和 DOTPROD 的 内 容 ， 在 R3, R3, #1 递减 计数 器 
循环 的 前 两 条 指令 中 使 用 后 变 址 寻 iD 人 则 转移 回 到 前 面 
址 方式 ( 总 是 包含 写 回 )。 乘 法 累 一 





加 指令 (MLA ) 执行 必要 的 算术 图 D-14 点 积 程序 
运算 。 它 将 R4 和 R5 中 的 向 量 元 素 相 乘 ， 并 将 得 到 的 乘积 累加 到 RO 中 。 


D.6.2 ”字符 串 搜索 程序 

图 D-15 中 的 ARM 程序 与 图 2-30 中 的 一 般 程 序 非常 相似 。 有 两 个 需要 注意 的 差别 。ARM 
程序 中 LOOP2 的 前 两 条 指令 使 用 了 后 变 址 寻 址 方式 ， 这 就 不 需要 使 用 一 般 程序 LOOP2 中 的 
两 条 ADD 指令 ; 这 里 需要 使 用 三 对 ARM 指令 CMP/BNE、CMP/BGT 以 及 CMP/BGE 来 实现 
三 条 一 般 的 Branch if 指令 。 
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R2, =T 将 地 址 T 装 入 R2 

R3, =P 

R4,N 

R5, M 

R4, R4, R5 计算 n-m 

R4, R2, R4 R4 是 Tl(n 一 m) 的 地 址 
R5, R3, R5 R5 是 P(m) 的 地 址 
R6, R2 用 R6 遍历 字符 串 7 
R7, R3 用 R7 遍历 字符 串 P 
R8, [R6], #1 比较 字符 串 T 和 PP 中 
R9, [R7],#1 的 一 对 字符 

R8, R9 

NOMATCH 

R5, R7 检查 是 否 在 P(m) 中 
LOOP2 如 果 没 有 完成 再 次 循环 
R2, RESULT 保存 TD 的 地 址 


B 

NOMATCH , R2, 指向 了 中 的 下 一 个 字符 
检查 是 否 在 Tl(n - mm) 中 
如 果 设 有 完成 再 次 循环 
没有 发 现 匹 配 





图 D-15 字符 串 搜索 程序 


D.7 ”操作 模式 和 异常 


ARM 处 理 器 有 七 种 操作 模式 。 应 用 程序 是 在 用 户 模式 ( User mode ) 下 运行 的 。 有 五 种 
异常 模式 。 当 发 生 一 个 异常 时 进入 其 中 的 一 种 异常 模式 。 第 七 种 操作 模式 是 系统 模式 〈 System 
mode )， 只 能 从 其 中 一 种 异常 模式 进入 系统 模式 ， 这 将 在 D.7.3 节 中 进行 讨论 。 

五 种 异常 模式 以 及 导致 进入 异常 模式 的 异常 总 结 如 下 : 

e 当 外 部 设备 为 获得 紧急 服务 而 发 出 一 个 快速 中 断 请 求 时 ， 进 入 快速 中 断 ( FIQ ) 模式 。 

e 当 外 部 设备 发 出 一 个 正常 的 中 断 请 求 时 ， 进 入 普通 中 断 ( IRQ ) 模式 。 

e 在 系统 上 电 或 复位 时 ， 或 者 当 用 户 程序 执行 一 条 软件 中 断 指令 ( SWI ) 来 调用 一 个 操作 

系统 程序 执行 时 ， 进 入 管 态 ( Supervisor，SVC ) 模式 。 

e 在 当前 程序 试图 读 取 一 条 (个 ) 可 导致 存储 器 访问 冲突 的 指令 或 数据 操作 数 时 ， 进 入 


存储 器 访问 冲突 (终止 ) 模式 。 639 
e 在 当前 程序 试图 执行 一 条 未 实现 的 指令 时 ， 进 入 未 实现 的 指令 (未 定义 ) 模式 。 640 


状态 寄存 器 中 的 中 断 禁 止 位 I 和 下 可 用 来 确定 当 在 相应 的 中 断 线 (IRQ 和 FIQ) 上 发 出 中 
断 请 求 时 ， 处 理 器 是 否 被 中 断 。 如 果 禁 止 位 为 1， 则 处 理 器 不 会 被 中 断 ; 如 果 禁 止 位 为 0， 则 
处 理 器 就 会 被 中 断 。 

五 种 异常 模式 和 系统 模式 都 是 特权 模式 (privileged mode )。 当 处 理 器 处 于 特权 模式 下 时 ， 
允许 访问 状态 寄存 器 ( 图 D-1 中 的 CPSR )， 所 以 可 以 对 模式 位 和 中 断 禁 止 位 进行 操作 ， 这 可 
以 通过 一 些 不 可 在 用 户 模式 〈 非 特权 模式 ) 下 使 用 的 指令 来 完成 。 


D.7.1 后 备 寄存 器 


当 处 理 器 运行 在 用 户 模 式 或 系统 模式 下 时 ， 都 会 使 用 图 D-1 所 示 的 16 个 普通 的 处 理 器 寄 
存 器 。 当 发 生 一 个 异常 且 从 用 户 模 式 切换 到 其 中 一 种 异常 模式 时 ，16 个 寄存 器 中 的 某 一 些 会 
被 同等 数量 的 后 备 寄存 器 替换 ， 如 D.2 节 所 述 。 被 替换 的 寄存 器 其 内 容 保持 不 变 。 每 一 种 异常 
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模式 都 有 一 组 不 同 的 后 备 寄存 器 ， 在 图 D-16 中 用 灰色 显示 。 
通用 寄存 器 和 程序 计数 器 












用 户 / 系 统 FIQ IRQ 管 态 终止 未 定义 
EE wo | 
| | 
Re | ro [| re 
Re | ns || rs | 
| | || 2 
ET | 
ET 
Ey 





处 理 器 状态 寄存 器 


CPSR CPSR CPSR CPSR CPSR CPSR 
SPSR_fiq SPSR_irq SPSR_svc SPSR_abt | | SPSR_und 


图 D-16 ARM 处 理 器 不 同 模式 下 的 可 访问 寄存 响 


当 异 常 发 生 时 ， 从 用 户 模式 切换 到 相应 的 异常 模式 时 将 执行 如 下 操作 : 

1 ) 程序 计数 器 (R15 ) 的 内 容 被 装 入 异常 模式 的 后 备 链接 寄存 器 ( R14_mode ) 中 。 

2 ) 状态 寄存 器 ( CPSR ) 的 内 容 被 装 入 后 备 的 备份 状态 寄存 器 ( SPSR_mode ) 中 。 

3 ) 改变 CPSR 的 模式 位 来 表示 相应 的 异常 模式 ， 并 将 中 断 禁 止 位 I 和 下 进行 适当 的 设置 。 

4 ) 将 相应 的 异常 向 量 地 址 装 入 程序 计数 器 ( R15 ) 中 ,该 地 址 处 的 指令 被 提取 并 执行 以 
开始 异常 服务 程序 。 

活跃 的 堆栈 指针 寄存 器 ( R13_mode ) 始终 指向 处 理 器 堆栈 的 栈 顶 元 素 ， 该 堆栈 位 于 为 相 
关 的 异常 模式 分 配 的 存储 区 域 中 。R13_mode 的 内 容 由 操作 系统 初始 化 。 

当 异 常服 务 程序 执行 完成 时 ， 需 要 返回 到 用 户 模 式 ， 继 续 执行 被 中 断 的 程序 。 这 是 通过 
将 模式 链接 寄存 器 ( R14_mode ) 中 的 内 容 传 送 给 程序 计数 器 以 及 将 备份 状态 寄存 器 ( SPSR_ 
mode ) 中 的 内 容 传送 给 状态 寄存 器 ( CPSR ) 来 完成 的 。 

我 们 已 经 对 刚刚 描述 的 从 用 户 模式 切换 到 异常 模式 ， 然 后 又 切换 回 用 户 模式 的 操作 进行 
了 笼统 地 介绍 。 实 际 的 异常 和 所 进入 的 模式 的 不 同 也 使 操作 细节 有 所 不 同 。 在 下 面 的 章节 中 我 
们 将 进一步 描述 这 些 细节 。 
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D.7.2 异常 的 类 型 

异常 有 七 种 。 表 D-3 列 出 了 这 些 异 常 以 及 异常 发 生 时 所 进入 的 处 理 器 模式 ， 表 中 还 列 出 

了 异常 的 向 量 地 址 。 在 地 址 空间 低 端 的 这 些 字 单 元 必须 包含 可 跳 转 到 异常 服务 程序 开始 的 转移 

指令 。 快 速 中 断 程序 可 以 立即 开始 ， 而 不 需要 转移 指令 ， 因 为 它 的 向 量 地 址 (28 ) 在 列表 的 最 

后 。 当 多 个 异常 同时 发 生 时 ， 它 们 被 服务 的 优先 顺序 如 表 D-3 的 最 后 一 列 所 示 。 
表 D-3 异常 和 处 理 器 模式 

En TE 
ee 

| 

fk 所 | WwWsGvO | ss | 

tw | WwWsGvO | | 
一 st | 


3 
4 
1 
2 
5 
6 


数据 访问 冲突 终止 | 

指令 访问 # 灾 | 区 |  D 

未 实现 的 指令 未 十 | 
对 异常 更 为 详细 的 描述 如 下 


e 快速 中 断 (FIQ ) 和 普通 中 断 (IRQ ) 一 一 输入 /输出 设备 使 用 两 根 中 断 请 求 线 中 的 一 
根来 请 求 服务 。FIQ 中 断 用 于 一 台 或 少数 几 台 设备 需要 快速 响应 的 情况 。 除 了 堆栈 指针 
寄存 器 R13_fiq 和 链接 寄存 器 R14 fiq 之 外 ， 图 D-16 所 示 的 FIQ 处 理 器 模式 的 后 备 寄 
存 器 还 包括 五 个 通用 寄存 器 R8_fiq 到 R12_fiq。 如 果 这 五 个 通用 寄存 器 能 为 FIQ 中 断 服 
务 程 序 提供 足够 的 工作 空间 ， 那 么 将 不 再 需要 保存 和 恢复 其 他 的 用 户 模式 寄存 器 。 其 
他 所 有 的 IO 设备 都 使 用 了 RQ 中 断 线 来 请 求 服务 。 

软件 中 断 一 一 用 户 程 序 通过 执行 SWI 指令 来 请 求 操作 系统 的 服务 。 这 是 一 种 可 导致 处 
理 器 进入 管 态 模式 的 异常 。 指 令 中 的 参数 字段 指明 了 所 请 求 的 服务 ， 并 且 管 态 程序 可 
以 访问 该 参数 字段 。 


高 的 一 种 异常 。 它 使 处 理 器 处 于 一 个 已 知 的 初始 状态 ， 使 
得 操作 系统 软件 可 以 正常 开始 或 重新 启动 。 该 异常 发 生 时 ， 任 何 程序 的 执行 都 会 被 中 止 。 
数据 和 指令 访问 冲突 一 一 处 理 器 的 实现 中 可 能 包括 一 个 存储 器 管理 单元 ， 该 单元 将 程 
序 限制 到 其 指令 和 数据 地 址 空间 的 有 效 区 域 中 。 我 们 需要 这 样 一 个 单元 来 实现 第 8 章 
所 描述 的 虚拟 存储 器 。 如 果 处 理 器 发 出 的 指令 提取 地 址 或 数据 操作 数 访问 地 址 在 其 有 
效 区 域 之 外 ， 那 么 就 会 发 生 一 个 异常 并 进入 终止 ( Abort ) 模式 。 该 模式 也 能 处 理 这 样 
一 种 情况 : 地 址 是 有 效 的 ,但 目前 并 未 映射 到 主 存 中 ,需要 从 辅助 存储 设备 进行 传输 。 
未 实现 的 指令 一 一 如 果 处 理 器 试图 执行 一 条 指令 ,但 该 指令 并 未 在 硬件 中 实现 ， 就 会 
发 生 一 个 异常 并 进入 未 定义 (Undefined ) 模式 。 例 如 ， 浮 点 算术 运算 可 以 被 特殊 的 硬 
件 支 持 ， 但 在 当前 的 处 理 器 中 可 能 还 没有 实现 。 在 这 种 情况 下 ,异常 的 发 生 可 能 会 使 
得 处 理 器 去 执行 实现 该 浮 点 运算 的 软件 。 


D.7.3 ”系统 模式 

系统 模式 是 同 用 户 模 式 使 用 同样 寄存 器 的 一 种 特权 模式 。 系 统 模式 只 能 从 另外 一 种 异常 模 
式 进 入 。 该 模式 的 目的 是 为 了 在 异常 处 理 期 间 能 很 容易 地 链接 到 子 程序 中 ， 而 不 覆盖 链接 寄存 
化 R14_ mode 的 内 容 。 当 处 于 系统 模式 下 时 ， 子 程序 调用 指令 使 用 正常 的 链接 寄存 器 R14。 从 所 
有 的 子 程序 调用 返回 后 ， 重 新 进入 原来 的 异常 模式 ， 并 可 重新 访问 链接 寄存 器 R14_mode。 
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D.7.4 异常 处 理 

当 出 现 一 个 异常 后 ， 从 用 户 模式 切换 到 相应 的 异常 模式 ， 然 后 再 返回 到 用 户 模 式 所 需 的 
一 般 操作 已 经 在 D.7.1 节 中 进行 了 简要 介绍 。 这 些 操 作 的 细节 有 所 不 同 ， 主 要 取决 于 异常 和 所 
进入 的 异常 模式 。 在 这 里 ， 我 们 考虑 一 些 这 样 的 细节 。 

1. 流水 执行 、 程 序 计 数 器 和 状态 寄存 器 

ARM 处 理 器 将 连续 指令 的 提取 和 执行 重 玲 起 来 ， 以 提高 指令 的 吞吐 量 。 这 种 技术 被 称 为 
指令 的 流水 线 执行 。 我 们 已 经 在 第 6 章 中 进行 了 描述 。 在 指令 的 流水 线 执行 过 程 中 ， 程 序 计数 
器 的 更 新 按 如 下 步骤 进行 。 假 设 处理 器 从 地 址 A 提取 指令 I1。PC 的 内 容 递增 为 A+ 4， 然 后 开 
始 执行 。fD 的 执行 完成 之 前 ， 处 理 器 从 地 址 A+ 4 提取 指令 了， 然后 将 PC 递增 为 A+8。 

现在 假设 在 1 执行 结束 时 ， 处 理 器 发 现 已 经 收 到 了 一 个 普通 的 中 断 请 求 (IRQ )。 处 理 
器 执行 D.7.1 节 所 描述 的 操作 ， 进 入 IRQ 异常 模式 去 处 理 该 中 断 。 它 将 CPSR 的 内 容 复制 到 
SPSR irq 中 ,将 PC 的 内 容 (现在 是 A+8) 复制 到 链接 寄存 器 R14 irq 中 。 已 经 提取 但 尚未 
完全 执行 的 指令 了 将 被 丢弃 。 而 中 断 服务 程序 必须 返回 到 该 指令 (E )。 所 以 中 断 服 务 程 序 必 
须 从 R14 irq 中 减 去 4， 然后 再 将 其 内 容 作 为 返回 地 址 。 还 必须 恢复 已 保存 的 状态 寄存 器 的 副 
本 。 所 需 的 操作 可 由 单一 一 条 指令 

SUBS PC, R14 irq,#44 
来 实现 ， 该 指令 从 R14_irq 中 减 去 4 并 将 结果 保存 到 PC 中 。 操 作 码 中 的 后 缀 S 通常 是 指 “ 设 
置 条 件 码 ”"。 但 是 ， 当 指令 的 目的 寄存 器 是 PC 时 ， 后缀 S 会 使 得 处 理 器 将 SPSR_irq 的 内 容 复 
制 到 CPSR 中 ， 从 而 完成 返回 到 被 中 断 的 程序 所 需 的 操作 。 
表 D-4 从 异常 返回 时 的 地 址 修正 


异 党 返回 指令 
未 定义 的 指令 MOVS PC, R14_und 
A ee 
和 
天 SA 


PC 是 导致 异常 的 指令 地 址 。 对 于 IRQ 和 FIQ 来 说 ， 它 是 第 一 条 由 于 中 断 而 未 被 执行 的 指令 地 址 


在 执行 SWI 指令 而 触发 一 个 软件 中 断 的 情况 下 ， 保 存在 R14_svc 中 的 值 是 正确 的 返回 地 
址 。 从 一 个 软件 中 断 返 回 的 操作 可 以 通过 使 用 指令 
MOVS PC,RI14 sve 
来 完成 ， 该 指令 也 将 SPSR_svc 的 内 容 复 制 到 CPSR 中 。 
表 D-4 给 出 了 正确 的 返回 地 址 值 以 及 表 D-3 中 除了 上 电 /复位 (该 异常 会 中 止 任何 当前 正 
在 执行 的 程序 ) 之 外 的 每 个 异常 用 来 返回 到 被 中 断 程 序 的 指令 。 注 意 ， 对 于 数据 访问 或 指令 访 
问 冲 突 ， 返 回 地 址 是 导致 异常 的 指令 地 址 ， 因 为 在 解决 了 冲突 之 后 ， 该 指令 必须 被 重新 执行 。 
2. 对 状态 寄存 器 中 的 位 进行 操作 
当 处 理 器 在 特权 模式 下 运行 时 ， 可 以 使 用 特殊 的 Move 指令 MRS 和 MSR 来 向 或 从 通用 
寄存 器 传输 当前 或 已 保存 的 处 理 器 状态 寄存 器 的 内 容 。 例 如 ， 指 令 
MRS Rd CPSR 
将 CPSR 的 内 容 复制 到 寄存 器 Rd 中 。 类 似 地 ， 指 令 
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MSR SPSR,Rm 

将 寄存 器 Rm 的 内 容 复 制 到 SPSR_mode 中 。 

状态 寄存 器 的 内 容 被 装 人 寄存 器 之 后 ， 可 以 使 用 逻辑 指令 来 对 单个 的 位 进行 操作 。 然后 ， 
该 寄存 器 的 内 容 可 被 复制 回 到 状态 寄存 器 中 以 完成 所 需 的 更 改 。 例 如 ， 这 些 步 又 可 用 于 设置 或 
清除 异常 服务 程序 中 的 中 断 禁 止 位 。 我 们 将 在 D.8 节 中 处 理 IO 设备 中 断 时 看 到 如 何 完成 这 样 
的 操作 。 

3. 异常 服务 程序 的 娩 套 

回顾 一 下 ， 子 程序 的 嵌 套 是 比较 容易 的 ， 可 通过 将 链接 寄存 器 的 内 容 保存 到 与 子 程序 
( 该 子 程序 调用 了 男 一 个 子 程序 ) 相关 的 栈 结构 中 来 实现 。 但 是 ， 当 一 个 异常 服务 程序 被 一 个 
具有 更 高 优先 级 且 其 服务 程序 运行 在 不 同 处 理 器 模式 下 的 异常 打 断 时 ， 则 不 需要 该 操作 。 这 是 
因为 每 种 模式 都 有 其 自己 的 后 备 链接 寄存 器 。 

例如 ， 假 设 一 个 IRQ 模式 的 例 程 正在 处 理 一 个 普通 中 断 ， 这 时 接收 到 一 个 需要 获得 快速 
服务 的 中 断 。 该 例 程 被 中 断 并 进入 FIQ 模式 来 处 理 第 二 个 中 断 。 被 中 断 而 转 去 处 理 IRQ 中 断 
的 程序 其 返回 地 址 在 链接 寄存 器 R14_irq 中 保持 不 变 。 而 IRQ 例 程 的 返回 地 址 保存 在 R14 fiq 
中 - 因此 ， 使 用 后 备 寄存 器 可 以 避免 覆盖 已 保存 的 返回 地 址 ， 并 且 当 出 现 异 常 程序 对 套 时 ， 不 
需要 将 这 些 地 址 放 到 栈 中 -。 但 是 ， 如 果 在 同一 处 理 器 模式 下 处 理 不 同 的 异常 的 话 ， 就 需要 将 它 
们 的 返回 地 址 进行 保存 ( 如 果 人 允许 嵌 套 的 话 )。 


D.8 输入 /输出 


ARM 体系 结构 采用 的 是 3.1 节 中 描述 过 的 存储 器 映射 IO 方法 。 正 如 在 3.1.2 节 中 介绍 
的 ， 从 键盘 读 取 一 个 字符 或 向 显示 器 发 送 一 个 字符 都 可 以 通过 程序 控制 TO 来 完成 ， 也 可 以 通 
过 3.2 节 中 描述 的 中 断 驱 动 IO 来 完成 。 本 节 将 通过 介绍 一 些 程序 示例 来 说 明 这 两 种 方法 ， 
这 些 程序 示例 显示 了 第 3 章 中 的 一 般 程序 ( 涉及 键盘 和 显示 设备 ) 是 如 何 用 ARM 汇编 语言 
实现 的 。 


D.8.1 程序 控制 |/O 
我 们 首先 给 出 一 个 从 键盘 读 取 字 符 和 将 字符 写 到 显示 器 的 短 指令 序列 。 
1. 键盘 字符 输入 
假设 键盘 接口 中 的 数据 、 状 态 和 控制 寄存 器 的 布局 如 图 3-3a 所 示 。 此 外 ,假设 地 址 
KBD_DATA ( 0x4000 ) 已 经 装 入 寄存 器 R1 中 。 指 令 序列 
READWAIT LDRB  R3,[R1,#4] 
TST R3, #2 
BEQ READWAIT 
LDRB  R3,[R1] 
当 键盘 上 有 一 个 键 被 按 下 时 将 该 字符 读 人 到 寄存 器 R3 中 。 测 试 (TST ) 指令 对 它 的 两 个 操作 
数 进行 按 位 逻辑 与 操作 ， 并 根据 结果 来 设置 条 件 码 标志 。 立 即 数 2 在 bi 位 上 是 1。 因此 ，TST 
操作 的 结果 直到 KIN = 1 之 前 都 将 是 0，KIN=1 意味 着 在 KBD_DATA 中 有 一 个 字符 存在 。 如 
果 KIN = 0， 则 BEQ 指令 转移 返回 到 READWAIT。 这 将 一 直 循环 直到 有 按键 被 按 下 将 KIN 设 
置 为 1 时 为 止 。 然 后 ， 不 再 发 生 转 移 ， 而 是 将 该 字符 装 和 寄存 器 R3 中 。 
2. 显示 器 字符 输出 
假设 地 址 DISP_DATA 已 经 被 装 人 寄存 器 R2 中 ， 指 令 序列 
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WRITEWAIT LDRB R4, [R2, #4] 
TST R4, #4 
BEQ WRITEWAIT 
STRB R3, [R2] 


当 显 示 器 准备 接受 字符 时 将 寄存 器 R3 中 的 字符 发 送 到 DISP_DATA 寄存 器 中 。 
3. 完整 的 输入 / 输出 程序 
刚刚 描述 的 两 个 程序 可 以 从 键盘 读 READ LDRB R3, [R1, #4] 载 信 KBD ， STATUS 字 节 入 


取 一 行 字符 ， 将 它们 存储 到 存储 器 中 ， 并 等 待 字符 
并 将 它们 显示 在 显示 器 上 ， 如 图 D-17 R3 [R1] 让 字符 并 将 其 保存 在 丰 
中 的 程序 所 示 。 该 程序 模仿 了 图 3-4 中 R3, [ROJ, #1 1 

R4.[R2,#4] 载 人 DIS 字 节 
的 一 般 程序 。 假 设 寄存 器 RO 中 保存 了 STR 并 等 和 显示 器 
将 要 存储 该 行 字符 的 存储 区 域 的 第 一 个 人 ns 你 
字 节 的 地 址 ， 寄 存 器 Rl 到 R4 与 刚刚 R3, #CR 如 果 不 是 回 车 符 ， 则 继 





描述 的 READWAIT 和 WRITEWAIT 循 READ 续 读 取 字符 

环 中 的 用 法 相同 。 第 一 条 Store 指令 图 D-17 读 取 一 行 字符 并 进行 显示 的 程序 
(STRB ) 将 从 键盘 读 入 的 字符 存储 到 存储 器 中 。 该 指令 中 采用 带 写 回 的 后 变 址 寻 址 方式 来 凯 
历 存储 区 。 测 试 相等 的 指令 (TEQ ) 用 来 检测 两 个 操作 数 是 否 相 等 ， 并 相应 地 设置 Z 条 件 码 


D.8.2 中断 驱动 IO 

D.7 节 中 描述 的 ARM 中 断 设 施 可 以 在 中 断 驱动 的 控制 下 读 取 键 盘 上 输入 的 一 行 字 符 。 我 
们 假设 键盘 有 其 自己 的 中 断 请 求 线 连接 到 处 理 器 的 IRQ 中 断 输 入 端 。 

可 能 会 有 很 多 设备 可 在 IRQ 线 上 发 出 中 断 。 如 果 是 这 样 的 话 ， 可 在 IRQ 中 断 服务 程序 中 
按 某 种 优先 级 顺序 对 这 些 设备 进行 软件 轮 询 ， 以 识别 出 第 一 个 发 出 中 断 的 设备 。 为 简单 起 见 ， 
我 们 将 假设 键盘 是 唯一 一 个 可 在 IRQ 线 上 发 出 中 断 请 求 的 设备 。 

图 3-8 给 出 了 一 个 一 般 程序 ， 该 程序 使 用 中 断 方式 来 读 取 一 行 字符 直到 遇 到 一 个 回 车 符 
(CR )。 在 从 键盘 读 取 这 些 字符 的 时 候 ， 中 断 服 务 程序 使 用 程序 控制 VO 方式 将 它们 发 送 给 显 
示 器 。 我 们 将 在 ARM 处 理 器 上 实现 该 任务 。 在 IRQ 处 理 器 模式 SPSR_irq 下 ， 状 态 寄存 器 
CPSR 和 备份 状态 寄存 器 是 与 中 断 处 理 相关 的 处 理 器 控制 寄存 器 。 

该 IO 程序 示例 中 ， 需 要 使 用 以 下 这 些 存储 单元 : 

e@ PNTR 是 一 个 指针 单元 ， 其 中 包含 从 键盘 读 取 的 下 一 个 字符 将 要 装 人 的 存储 器 地 址 。 

e LINE 是 该 行 第 一 个 字符 将 要 放置 的 存储 器 字 节 单元 。 

e EOL 是 一 个 包含 一 个 二 进 制 变量 的 存储 单元 ， 该 变量 向 主 程序 说 明 已 经 读 取 了 一 

整 的 行 。 

图 D-18 给 出 了 一 个 ARM 的 IRQ 中 断 服务 程序 和 一 个 主 程序 ， 它 们 分 别 对 应 于 图 3-8 中 
的 中 断 服务 程序 和 主 程序 。 假 设 主 程序 在 管 态 模 式 下 运行 。 前 六 条 指令 将 PNTR 初始 化 为 地 址 
LINE、 清 除 EOL 标志 ， 并 在 键盘 控制 寄存 器 KBD_ CONT 中 人 允许 中 断 。 最 后 一 条 指令 通过 使 
用 MSR 指令 将 十 六 进 制 值 50 装 入 CPSR 中 ， 从 而 清除 了 Q 禁止 位 (1) 并 使 处 理 器 切换 到 用 
户 模式 。 

该 IRQ 中 断 服务 程序 与 图 3-8 中 的 一 般 程序 非常 相似 。 为 简单 起 见 ， 许 多 Load 和 Store 
指令 使 用 相对 寻 址 方式 ， 假 设 所 列 出 的 存储 单元 和 设备 寄存 器 都 在 相对 于 程序 计数 器 的 偏 移 量 


可 达到 的 范围 之 内 。 


中 断 服务 程序 


IRQLOC STMFD 
LDR 
LDRB 
STRB 


图 D-18 


D.9 指令 的 条 件 执行 


所 有 的 ARM 指令 都 可 有 条 件 地 执行 ， 


R13!, {R2, R3} 
R2, PNTR 

R3, KBD_DATA 
R3, [R2], #1 


R2. PNTR 

R2, DISP_STATUS 
R2, #4 

ECHO 

R3, DISP_DATA 


R2, KBD_CONT 
R13!, HR2 R3} 
R15, R14, #4 


R2, =LINE 

R2, PNTR 

R2, #0 

R2, EOL 

R2, #2 

R2, KBD_CONT 
R2, #&50 

CPSR, R2 





编写 的 程序 ( 其 中 包含 很 多 转移 指令 )。 
考虑 下 面 的 例子 。 图 D-19a 给 出 了 一 个 程序 的 
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将 R2 和 R3 的 内 容 保 存 到 栈 中 
载 人 地 址 指针 

从 键盘 读 取 字 符 

将 字 符 写 人 存储 器 并 递增 指针 


更 新 存储 器 中 的 指针 
等 待 显示 器 准备 就 绪 


向 显示 器 发 送 字符 

检查 字符 是 否 为 回 车 符 

如 果 不 是 回 车 符 (CR )， 则 返回 

如 果 是 回 车 符 (CR )， 则 指示 该 行 结束 


禁止 键 
盘 中 断 
恢复 寄存 器 ， 并 从 中 断 返回 


初始 化 缓冲 区 指针 
清除 行 结束 指示 变量 

允许 键盘 中 断 

允许 IRQ 中 断 ， 并 切换 到 用 户 模式 


一 个 使 用 中 断 方式 从 键盘 读 取 一 行 字符 并 使 用 轮 询 方式 显示 该 行 字符 的 程序 
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这 人 允许 编写 更 短 的 程序 以 替换 为 传统 的 RISC 机 器 


循环 部 分 ， 该 循环 使 用 RISC 风格 的 指令 来 找 出 两 个 
非 零 正 整数 的 最 大 公约 数 ( GCD ) [4]。 当 进入 该 程 
序 时 ， 这 两 个 数 分 别 包 含 在 寄存 器 R2 和 R3 中 。 在 
每 遍 循环 的 开始 处 ， 如 果 这 两 个 数 不 相等 ， 那 么 该 
程序 将 从 较 大 的 数 中 减 去 较 小 的 数 ， Se 
的 开始 。 如 果 这 两 个 数 相 等 ， 则 从 循环 中 退出 ， 


Branch_if_[R2]=[R3] 
Branch_if_[R2] >[R3] 


Subtract 
Branch 
Subtract 
Branch 


下 一 条 指令 





NEXT 
REDUCE 
R3, R3, R2 
LOOP 

R2, R2, R3 
LOOP 


a ) 使 用 RISC 风格 指令 的 GCD 算法 


到 位 置 NEXT 处 ，GCD 就 包含 Pir 。 
该 任务 的 ARM 程序 如 图 D-19b 所 示 。Compare 
指令 用 来 设置 条 件 码 。 每 条 Subtract 指令 中 的 操作 
码 后 组 都 指定 了 执行 Subtract 指令 的 条 件 。 仅 当 寄 
存 器 R2 的 内 容 大 于 寄存 器 R3 的 内 容 时 ， 才 执行 第 
一 条 Subtract 指令 ; 只 有 寄存 器 R3 的 内 容 大 于 寄存 


LOOP CMP R2, R3 
SUBGT  R2, R2, R3 


SUBLT R3,R3,R2 


BNE LOOP 
NEXT 下 一 条 指令 


b ) 使 用 ARM 指令 的 GCD 算法 
图 D-19 指令 的 条 件 执行 





650 


[651 


424 : 附录 D ARM 处 理 器 


器 R2 的 内 容 时 ， 才 执行 第 二 条 Subtract 指令 。 在 每 遍 循 环 中 ， 当 这 两 个 寄存 器 的 内 容 不 相等 
时 ， 只 执行 其 中 一 条 Subtract 指令 。 当 这 两 个 寄存 器 的 内 容 相等 时 ( 这 可 能 是 初始 情况 )， 这 
两 条 Subtract 指令 都 不 会 被 执行 ， 且 不 会 发 生 转 移 跳 回 到 LOOP 处 。 

当 传 统 代 码 中 Branch 指令 的 密度 相对 较 高 时 ， 上 述 情况 所 产生 的 较 短 的 ARM 代码 序列 
是 最 有 效 的 。 节 省 代码 空间 在 一 些小 型 的 嵌入 式 系统 应 用 中 是 非常 重要 的 -。 


D.10 ” 协 处 理 器 


被 称 为 协 处 理 器 (coprocessor ) 的 硬件 单元 可 以 连接 到 ARM 处 理 器 上 。 它 们 可 用 来 执行 
基本 ARM 指令 集中 所 没有 包含 的 操作 。 其 中 一 个 例子 是 可 以 对 浮 点 数 进行 算术 运算 的 硬件 单 
元 。 其 他 的 例子 包括 可 对 数字 信号 或 视频 数据 进行 特定 处 理 的 硬件 单元 。 使 用 包含 如 下 三 种 类 
型 的 ARM 指令 扩展 集 的 协 处 理 器 编写 程序 将 会 更 加 方便 : 

e 协 处 理 器 中 的 数据 操作 

e ARM 和 协 处 理 器 寄存 器 之 间 的 传输 

e 存储 器 和 协 处 理 器 寄存 器 之 间 的 Load 和 Store 传输 

一 种 用 来 综合 硬件 实现 的 定义 协 处 理 器 单元 的 软件 可 与 定义 基本 ARM 处 理 器 的 软件 结合 
起 来 ， 以 便 将 协 处 理 器 单元 和 ARM 处理 器 集成 为 一 个 芯片 。 


D.11 骨 入 式 应 用 和 Thumb ISA 


低 成 本 、 低 功 耗 的 嵌入 式 系统 ， 如 移动 电话 ， 是 ARM 处 理 器 的 主要 应 用 领域 。 这 种 系统 
的 设计 者 努力 减少 存储 需要 的 程序 所 需 的 片上 存储 空间 的 大 小 。 在 D.9 节 中 我 们 可 以 看 到 ， 指 
令 的 条 件 执行 可 减少 代码 空间 。 用 来 在 多 个 寄存 器 和 一 个 存储 器 字 块 之 间 传 输 字 的 块 传输 指 
令 ， 也 可 以 减少 代码 空间 。 

使 用 最 常用 的 ARM 指令 的 子 集 可 进一步 减少 代码 空间 ， 该 子 集中 的 每 一 条 指令 只 使 用 
16 位 来 表示 。 这 个 子 集 被 称 为 Thumb 指令 集 。Thumb 指令 的 执行 如 下 : 首先 ， 从 存储 器 中 提 
取 Thumb 指令 。 然 后 ， 将 这 些 Thumb 指令 从 16 位 的 编码 格式 解压 缩 (扩展 ) 为 相应 的 32 位 
ARM 指令 ， 并 以 通常 的 方式 执行 它们 。 

状态 寄存 器 (CPSR ) 中 的 bs; 位， 标记 为 T， 用 来 确定 到 达 的 指令 流 中 是 否 包 含 Thumb 
指令 (T= 1 ) 或 者 标准 的 32 位 ARM 指令 (T = 0 )。 一 个 程序 中 可 以 既 包含 Thumb 指令 例 程 ， 
也 包含 标准 指令 例 程 。 当 在 这 两 种 指令 集 之 间 进 行 切换 时 ， 需 要 特殊 的 指令 来 管理 T 位 。 

Thumb 指令 和 标准 的 指令 之 间 有 两 个 主要 的 区 别 。 首 先 ， 许 多 Thumb 指令 使 用 双 操作 数 
格式 ， 在 这 种 格式 中 目的 寄存 器 也 是 其 中 一 个 源 操 作 数 寄存 器 。 第 二 ， 条 件 执行 (适用 于 所 
有 标准 的 ARM 指令 ) 主要 用 于 Thumb 指令 集中 的 转移 指令 。 这 些 差异 可 节省 指令 编码 的 位 
空间 。 


D.12 结束语 


ARM 处 理 器 在 艇 和 人 式 系统 市 场 中 已 经 取得 了 显著 的 商业 成 功 。 其 设计 被 授权 给 一 些 制造 
手持 通信 设备 的 公司 。ARM 指令 集 的 16 位 Thumb 版 本 特别 适合 于 低 成 本 、 低 功 耗 的 应 用 ， 
因为 它 允 许 编写 简洁 型 的 程序 。 灵 活 的 变 址 寻 址 方式 和 32 位 ISA 中 的 块 传输 指令 对 于 许多 
应 用 都 是 非常 有 用 的 。 虽 然 这 两 个 特点 反映 了 CISC 风格 的 特性 ,但 ARM 通常 被 认为 是 具有 
RISC 风格 的 Load/Store 体系 结构 。 
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D.13 ”问题 解析 

本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解决 这 样 的 问题 。 

问题 : 假设 有 一 个 ASCII 编码 字符 

字 台地 址 

的 字 节 串 保存 在 存储 器 中 ， 起 始 地 址 为 re 
STRING。 该 字符 串 以 回 车 符 (CR ) 结 R4, #&0D 加 载 回 车 符 的 ASCII 码 
东 。 写 一 个 ARM 程序 来 确定 该 字符 串 te 
的 长 度 ， 并 将 所 得 到 的 长 度 存 储 在 单元 DONE 或 者 递增 长 度 计数 并 返回 ” 
LENGTH 中 。 #1 

解答 : 图 D-20 给 出 了 一 个 可 能 的 程 R3, LENGTH ”保存 字符 串 的 长 度 
序 。 将 字符 串 中 的 字符 与 CR (ASCII 码 
为 &0D ) 进行 比较 ， 计 数 器 递增 ， 直 至 图 D-20 例 D.1 的 程序 
到 达 字 符 串 的 末尾 。 


问题 : 写 一 个 ARM 程序 ， 在 一 个 32 位 的 非 负 整数 列表 中 找 出 最 小 的 数 。 程 序数 据 区 中 连续 的 存 
储 单元 SMALL 和 N 分 别 用 来 存储 最 小 的 数 和 列表 的 大 小 。 跟 在 这 两 个 单元 后 面 的 是 该 列表 ， 其 第 一 
个 数 存储 在 单元 ENTRIES 中 。 在 程序 中 包含 按照 规定 组 织 程序 和 数据 区 所 需要 的 汇编 指示 ( assembler 
directive )。 用 一 个 包含 7 个 整数 的 小 列表 作为 例子 。 

解答 : 程序 指令 和 数据 如 图 D-21 所 示 。 程 序 中 包含 的 注释 解释 了 该 程序 是 如 何 完成 所 需 任务 的 。 
注意 ， 将 地 址 ENTRIES 装 人 寄存 器 R2 的 方法 就 是 汇编 程序 在 之 前 的 程序 示例 中 所 使 用 的 替换 伪 指 令 的 
方法 ,在 D.5.1 节 中 进行 了 介绍 。 


CODE 


R2, POINTER R2 指向 ENTRIES 处 的 列表 
R3, [R2, # 一 4] 将 计数 器 R3 初始 化 为 n 

R5, [R2] R5 保存 目前 为 止 的 最 小 数 
R3, R3, #1 递减 计数 器 

DONE 如 果 R3 包含 了 0， 则 完成 
R6, [R2, #4]! 递增 列表 指针 并 获取 下 一 个 数 


R5, R6 检查 是 否 可 以 找到 更 小 的 数 
LOOP 如 果 没 有 找到 更 小 的 数 ， 则 转移 回 到 前 面 


R5, R6 和 否则， 将 找到 的 更 小 的 数 移 到 R5 中 
LOOP 然后 转移 回 到 前 面 
R5, SMALL 将 最 小 的 数 存储 到 SMALL 中 


DATA 

ENTRIES 指向 列表 开始 的 指针 
0 存储 最 小 数 的 单元 
7 列表 中 的 项 数 

4, 5, 3, 6, 1, 8,2 ”数字 列表 





图 D-21 例 D.2 的 程序 


问题 : 写 一 个 ARM 程序 ， 将 一 个 位 十 进 制 整数 转换 成 二 进 制 数 。 十 进 制 数 以 n 位 ASCII 编码 字 
符 的 形式 给 出 ， 并 将 其 存放 在 存储 器 的 连续 字 节 单元 中 ， 起 始 地 址 为 DECIMAL。 转 换 后 的 数 存 储 在 单 
元 BINARY 中 。 单 元 N 中 包含 值 n。 

解答 : 考虑 一 个 4 位 的 十 进 制 数 D= ddzdido。 其 值 可 由 表达 式 ((d; x 10+d) x 10+di) x 10+do 
给 出 。 该 表达 式 是 图 D-22 中 程序 所 使 用 的 转换 技术 的 基础 。 每 个 ASCII 编码 字符 先 被 转换 成 一 个 二 进 
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制 编码 的 十 进 制 (BCD ) 数字 ， 然 后 再 用 于 计算 。 这 里 假设 转换 后 的 二 进 制 值 可 以 用 不 超过 32 位 来 


将 计数 器 R2 初始 化 为 n 

R3 指向 ASCII 数字 

R4 用 来 保存 二 进 制 数 

R6 用 来 保存 常量 10 

获取 下 一 个 ASCII 字符 并 递增 指针 


产生 BCD 数字 

加 到 中 间 结 果 中 

递减 计数 器 

如 果 完 成 ， 则 保存 结果 
将 中 间 结 果 乘 以 10 
循环 回 到 前 面 

将 结果 存储 到 BINARY 中 





图 D-22 例 D.3 的 程序 


表示 。 
R2, N 

LDR ，R3, =DECIMAL 
MOV  R4,#0 
MOV  R6,#10 
LDRB RS5,[R3],#1 
AND ~ RS5,RS5,#&OF 
ADD  R4,R4,R5 
SUBS  R2,R2,#1 
BEQ DONE 
MUL  R4.R6,R4 
B LOOP 

DONE STR  R4,BINARY 


问题 : 考虑 一 个 数字 阵列 A(i, 刀 ， 其 中 = 0 到 n-1， 是 行 索引 , j = 0 到 mm-1， 是 列 索引 。 该 阵列 按 
行 存储 在 存储 器 中 ， 每 行 占 用 m 个 连续 的 字 单 元 。 写 一 个 ARM 子 程 序 ， 将 第 x 列 的 元 素 逐 一 加 到 第 y 
列 的 元 素 上 ， 并 将 和 元 素 ( sum element ) 存放 在 第 列 上 。 索 引 值 x 和 ?通过 寄存 器 R2 和 R3 传递 给 子 程 
序 。 参 数 n 和 m 通过 寄存 器 R4 和 R5 传递 给 子 程序 ， 元 素 A(0,0) 的 地 址 通过 寄存 器 R6 传递 给 子 程序 。 

解答 : 图 D-23 给 出 了 实现 该 任务 的 一 个 可 能 的 主 程序 和 子 程序 。 我 们 假定 值 x*、y、n 和 m 分 别 存 
储 在 存储 单元 X、Y、N 和 M 中 。 元 素 A(0,0) 的 地 址 是 ARRAY。 程 序 中 的 注释 解释 了 该 任务 是 如 何 完 
成 的 。 有 趣 的 是 ， 将 ARM 子 程序 中 的 指令 数 与 图 2-36 中 RISC 风格 子 程序 的 指令 数 进行 比较 ， 可 以 看 
出 ARM 子 程序 更 短 ， 这 是 由 于 ARM 子 程序 使 用 了 块 传输 指令 以 及 灵活 的 变 址 寻 址 方式 。 


R13!, {R10, R11, R14} 


R2, R6, R2, LSL #2 
R3, R6, R3, LSL #2 
R10, [R2], R5, LSL#2 


R11, [R3] 
R11, R11, R10 
R11, [R3], R5, LSL #2 


R4, R4, #1 
LOOP 
LDMFD R13!, {R10. R11,R15} 





载 人 值 x 
载 人 值 y 
载 入 值 n 
载 人 值 m 
载 和 元素 A(0,0) 的 地 址 ARRAY 


调用 子 程序 


将 寄存 器 R10、R11 和 链接 寄存 器 (R14 ) 
的 值 保存 到 堆栈 中 

将 A(0, x) 的 地 址 加 载 到 R2 中 

将 A(0,)?) 的 地 址 加 载 到 R3 中 

将 第 x 列 的 值 加 载 到 R10 中 ， 并 递增 列 地 址 


将 第 y 列 的 值 加 载 到 R11 中 
将 两 列 的 值 相 加 
将 和 存储 到 第 y 列 并 递增 列 地 址 


递减 行 计 数 器 ， 如 果 未 完成 则 循环 回 到 前 面 


恢复 寄存 器 R10、R11 和 程序 计数 器 (R15 ) 
的 值 、 并 从 子 程序 返回 


图 D-23 例 D.4 的 程序 


附录 D ARM 处 理 器 : 427 


问题 : 假设 存储 单元 BINARY 中 包含 一 个 32 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显 
示 设 备 上 将 这 些 位 显示 为 8 个 十 六 进 制 数字 字符 。 写 一 个 ARM 程序 完成 这 个 任务 ， 使 用 程序 控制 IO 来 


显示 字符 。 


解答 : 图 D-24 给 出 了 一 个 可 能 的 程序 。 首 先 ， 通 过 查 表 法 在 一 个 16 项 的 表 中 进行 查找 ， 将 十 六 
进 制 数字 转换 为 ASCI 字符 。 这 8 个 将 要 显示 的 ASCII 字符 存储 在 一 个 存储 器 字 节 块 中 ,起 始 地 址 为 
HEX。 然 后 ， 将 字符 发 送 给 显示 器 。 注 释 描述 了 程序 中 所 采取 的 具体 操作 。 注 意 LOOP 处 的 ORR 指令 ， 
它 对 寄存 器 R2 的 内 容 进行 循环 右 移 操作 。 每 次 循环 移 位 会 将 下 一 次 要 转换 的 4 位 十 六 进 制 数字 移 到 R2 





的 低 4 位 上 。 还 要 注意 的 是 ， 在 将 地 址 值 装 入 寄存 器 中 时 ， 使 用 了 ADR 伪 指 令 。ADR 指令 在 D.5.1 节 中 | | 
进行 了 介绍 。 655 

AREA CODE 
ENTRY 
MOV RO0,#0 ORR 指令 所 需 的 操作 
LDR R2,BINARY 加 载 二 进 制 模式 
ADR R3,TABLE R3 指向 ASCII 表 
ADR R4,HEX R4 指向 十 六 进 制 字 符 
MOV RS5,#8 加 载 数字 计数 
ORR ~ R2,R0,R2,ROR #28 将 下 一 个 数字 循环 移 位 到 低 4 位 上 
AND ~ R6,R2,#&F 提取 数字 ， 并 将 其 装 人 R6 中 
LDRB RY7,[R3,+R6] 加 载 数字 的 ASCII 码 
STRB CR7,[R4],#1 将 数字 保存 到 字符 串 中 ， 并 递增 指针 
SUBS RS5,RS5,#1 递减 数字 计数 器 
BGT LOOP 如 果 未 完成 ， 则 循环 回 到 前 面 

DISPLAY MOV RS5,#8 为 显示 例 程 加 载 数字 计数 
ADR R4, HEX R4 指向 十 六 进 制 字符 
ADR R2,DISP DATA R2 指向 设备 寄存 器 

SENDCHAR LDRB R3,[R2,#4] 通过 测试 DOUT 标志 来 检查 显示 器 
TST R3, #4 是 否 准备 就 绪 
BEQ SENDCHAR 
LDRB  R6,[R4], #1 获取 下 一 个 ASCII 字符 ， 并 递增 指针 
STRB  R6,[R2] 将 字符 发 送 给 显示 器 
SUBS RS5,R5,#1 递减 数字 计数 器 se 
BGT SENDCHAR 循环 ， 直 到 所 有 的 字符 都 显示 完毕 
下 一 条 指令 
AREA DATA 

二 进 制 模式 
et ASCII 编码 数字 的 存储 空间 
DCB  &30,8&31,6&32,833 ASCII 码 转 换 表 
DCB ~ &34,835,&36,&37 
DCB ~ &38,&39,&41,&42 
DCB ~ &43,644,&45,&46 
图 D-24 例 D.5 的 程序 656 


习题 





[E] D.1 假设 在 一 台 ARM 计算 机 中 ， 寄 存 器 RO、R1、R2、R6 和 R7 中 的 值 分 别 为 1000、2000、1016、 
20 和 30。 数字 1、2、3、4、5 和 6 存放 在 存储 器 中 起 始 地 址 为 1000 的 连续 字 单 元 中 。 每 次 都 以 
给 定 的 初始 值 开始 ， 请 问 执行 以 下 两 个 指令 块 的 效果 各 是 什么 ? 


(a) LDR R%8, [RO] 
LDR R9, [RO0,#4] 
ADD R10,R8,R9 
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(b) STR R6,[R1,#4]! 
STR RY7,[R1,#4]! 
LDR R8,[R1],#4 
LDR R9, [RI1], 地 
SUB R10,R8,R9 

[M] D.2 下 面 哪些 ARM 指令 会 使 得 汇编 程序 发 出 语法 错误 消息 ? 为 什么 ? 
(a) ADD R2,R2,R2 
(b) SUB RO0,R!1,[R2, #4] 

(c) MOV RO0,#2 1010101 
(d) MOV RO0,#257 
(e) ADD RO0,RI,RI1l,LSL#8 

[M] D.3 写 一 个 ARM 程序 ， 将 寄存 器 R2 中 各 个 位 的 顺序 颠倒 过 来 。 例 如 ， 如 果 R2 中 的 初始 值 是 
1110…0100， 则 R2 中 的 最 后 结果 应 该 是 0010…0111。( 提示 : 使 用 移 位 和 循环 移 位 操作 。 ) 

[M] D.4 考虑 图 D-7 中 的 程序 ， 列 出 BGT 指令 的 前 三 次 执行 中 每 一 次 执行 之 后 寄存 器 RO0、R1 和 R2 中 的 
内 容 。 将 结果 在 一 个 表 中 进行 显示 ， 该 表 以 三 个 寄存 器 作为 列 标题 。 用 三 行列 出 每 次 执行 BGT 
指令 之 后 这 三 个 寄存 器 中 的 内 容 。 图 D-13 给 出 了 该 程序 的 数据 。 

[M] D.5 写 一 个 ARM 程序 ， 比 较 两 个 字 节 列 表 中 的 相应 字 节 ， 并 把 较 大 的 字 节 存放 在 第 三 个 列表 中 。 这 
两 个 列表 分 别 从 字 节 单元 X 和 YY 开始， 而 较 大 字 节 的 列表 从 LARGER 开始 。 列 表 的 长 度 存放 在 
存储 单元 N 中 。 | 

[M] D.6 写 一 个 ARM 程序 ， 产 生 斐 波 纳 契 数列 的 前 个 数 。 在 此 数列 中 ， 前 两 个 数 是 0 和 1， 随后 的 每 
一 个 数 都 是 通过 将 前 面 的 两 个 数 相 加 产生 的 。 例 如 ， 当 n=8 时 ,该 数列 为 0, 1, 1, 2, 3, 5, 8， 
13。 你 的 程序 需要 将 数列 中 的 数 存 放 在 存储 器 中 起 始 地 址 为 MEMLOC 的 连续 字 单 元 中 。 假 设 值 
n 存储 在 单元 N 中 。 

[M] D.7 写 一 个 ARM 程序 ， 将 一 个 文本 字 (a word of text ) 从 小 写 转化 为 大 写 。 这 个 字 由 一 些 ASCII 字 
符 组 成 ， 这 些 字符 存放 在 存储 器 中 的 连续 字 节 单元 中 ， 起 始 地 址 为 WORD， 并 以 一 个 空格 字符 
结束 。( ASCII 码 参见 第 1 章 中 的 表 1-1。 ) 

[M] D.8 将 图 2-10 所 示 的 学 生成 绩 列表 修改 为 每 个 学 生 包 含有 j 项 测验 分 数 。 假 设 有 个 学 生 。 写 一 个 
ARM 程序 来 计算 每 项 测验 的 分 数 和 ， 并 将 这 些 和 存储 在 存储 器 中 地 址 为 SUM、SUM +4、SUM +8、…: 
的 字 单 元 中 。 由 于 测验 的 项 数 j 比 处 理 器 中 的 寄存 器 个 数 要 大 ， 所 以 图 D-8 所 示 的 用 于 3 项 测验 
的 程序 已 不 能 使 用 。 使 用 两 个 内 套 循环 ， 内 部 循环 累加 每 项 特定 测验 的 和 ， 而 外 部 循环 遍历 测 
验 的 数目 j。 假 设 j 存放 在 存储 单元 7 中 ,该 单元 在 图 2-10 中 的 单元 N 之 前 。 

[E] D.9 写 一 个 ARM 程序 ， 计 算 表 达 式 SUM = 580 + 68400 + 80000。 

[E] D.10 写 一 个 ARM 程序 ， 计 算 表 达 式 ANSWER =AxB+CxD。 

[M] D.11 写 一 个 ARM 程序 ， 在 一 个 含有 nn 个 32 位 整数 的 列表 中 找 出 所 包含 的 负 整 数 的 个 数 ， 并 将 
该 计数 保存 在 单元 NEGNUM 中 。n 保存 在 存储 单元 N 中 ,列表 中 的 第 一 个 整数 保存 在 单元 
NUMBERS 中 。 在 程序 中 包含 必要 的 汇编 指示 (assembler directive ) 和 一 个 样本 列表 ， 列 表 中 
含有 6 个 数字 ， 其 中 一 些 是 负数 。 

[M] D.12 为 第 2 章 中 例 2.5 所 描述 的 字 节 排序 程序 写 一 个 ARM 程序 。 

[M] D.13 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.22 中 的 问题 。 

[M] D.14 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.24 中 的 问题 。 

[M] D.15 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.25 中 的 问题 。 

[M] D.16 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.26 中 的 问题 。 

[M] D.17 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.27 中 的 问题 。 

[M] D.18 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.28 中 的 问题 。 

[M] D.19 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.29 中 的 问题 。 
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[M] D.20 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.30 中 的 问题 。 

[M] D.21 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.31 中 的 问题 。 

[D] D.22 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.32 中 的 问题 。 

[D] D.23 写 一 个 ARM 程序 来 解决 第 2 章 的 习题 2.33 中 的 问题 。 

[M] D.24 写 一 个 ARM 程序 ， 从 键盘 读 取 n 个 字符 ， 读 取 这 些 字符 的 同时 将 其 压 入 用户 堆栈 中 ， 然 后 再 
将 它们 回 显 到 显示 器 上 。 寄 存 器 R6 用 作 堆 栈 指针 。 计 数值 a 保存 到 存储 器 的 字 单 元 N 中 。 

[M] D.25 假设 图 D-17 所 示 的 程序 中 ， 提 取 和 执行 一 条 指令 所 需 的 平均 时 间 是 5 纳 秒 。 如 果 通 过 键盘 输 
入 字符 的 速度 为 每 秒 10 个 字符 ， 那 么 每 输入 一 个 字符 大 约 要 执行 多 少 次 BEQ READ 指令 ? 假 
设 显示 每 个 字符 所 需 的 时 间 远 小 于 在 键盘 上 连续 输入 两 个 字符 之 间 的 时 间 。 

[M] D.26 将 图 D-17 中 的 程序 改写 为 一 个 主 程序 调用 一 个 名 为 GETCHAR 的 子 程序 的 形式 ， 该 子 程序 读 
取 一 个 字符 并 调用 另 一 个 名 为 PUTCHAR 的 子 程序 来 显示 这 个 字符 。 地 址 KBD_STATUS 通 
过 寄存 器 R1 传递 给 GETCHAR， 而 主 程序 则 希望 通过 寄存 器 R3 来 获取 传递 回 的 字符 。 地 址 
DISP_STATUS 和 将 要 显示 的 字符 分 别 通过 寄存 器 R2 和 R3 传递 给 PUTCHAR。 任 一 子 程序 所 
使 用 的 任何 其 他 寄存 器 都 必须 由 子 程序 使 用 堆栈 ( 其 指针 在 寄存 器 R13 中 ) 来 保存 和 恢复 。 将 
字符 保存 到 存储 器 中 和 检查 行 结束 字符 CR 的 工作 都 在 主 程序 中 完成 。 

[M] D.27 使 用 堆栈 来 传递 参数 ， 重 复习 题 D.26。 

[M] D.28 写 一 个 ARM 程序 ， 从 键盘 接受 三 个 十 进 制 数字 。 每 个 数字 用 ASCII 码 ( 参见 第 1 章 中 的 
表 1-1 ) 表示 。 假 设 这 三 个 数字 表示 0 到 999 范围 内 的 一 个 十 进 制 整数 。 将 该 整数 转换 为 二 进 
制 数 表 示 形 式 。 先 接收 高 位 数字 。 为 了 方便 该 转换 ， 在 存储 器 中 保存 了 两 个 表 ， 每 个 表 有 10 
项 。 第 一 个 表 从 字 单 元 TENS 开始 ， 其 中 包含 十 进 制 值 0、10、20、…、90 的 二 进 制 表 示 。 第 
二 个 表 从 字 单 元 HUNDREDS 开始 ， 其 中 包含 用 二 进 制 表示 的 十 进 制 值 0、100、200、 
900。 

[M] D.29 使 用 两 个 嵌 套 子 程序 实现 习题 D.28 中 十 进 制 到 二 进 制 的 转换 程序 。 调 用 第 一 个 子 程序 的 主 程 
序 通过 将 两 个 参数 压 栈 ( 堆栈 指针 寄存 器 是 R13 ) 来 传递 参数 。 第 一 个 参数 是 一 个 3 字 节 存储 
器 缓冲 区 的 地 址 ， 该 缓冲 区 用 来 保存 所 输入 的 十 进 制 数字 字符 。 第 二 个 参数 是 用 来 保存 转换 后 
二 进 制 值 的 单元 地 址 。 第 一 个 子 程序 从 键盘 读 取 三 个 字符 ， 然 后 调用 第 二 个 子 程序 来 执行 转 
换 。 通 过 处 理 器 寄存 器 将 所 需要 的 参数 传递 给 第 二 个 子 程序 。 这 两 个 子 程序 都 必须 保存 它们 在 
堆栈 中 使 用 的 任 一 寄存 器 的 内 容 。 
(a ) 为 ARM 处 理 器 编写 这 两 个 子 程序 。 
(b ) 给 出 调用 第 二 个 子 程序 的 指令 执行 后 堆栈 中 的 内 容 。 

[M] D.30 写 一 个 ARM 程序 ， 在 视频 显示 器 的 一 行 上 以 十 六 进 制 形式 显示 主 存 中 10 个 字 节 的 内 容 。 该 字 
节 串 在 存储 器 中 的 起 始 位 置 是 LOC。 每 个 字 节 将 显示 为 两 个 十 六 进 制 字符 。 连 续 字 节 应 以 空格 
分 隔 。 

[M] D.31 假设 存储 单元 BINARY 中 包含 一 个 16 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显示 
设备 上 将 这 些 位 显示 为 0 和 1 组 成 的 字符 串 。 写 一 个 ARM 程序 完成 这 个 任务 。 

[M] D.32 使 用 图 3-17 中 的 七 段 显 示 器 和 图 3-14 中 的 定时 器 电路 ， 写 一 个 ARM 程序 ， 显 示 重 复 序列 0、 
1、2、…、9、0、… 中 的 十 进 制 数字 ， 每 个 数字 显示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 


100 MHz 的 时 钟 驱动 的 。 
[D] D.33 使 用 两 个 图 3-17 所 示 的 七 段 显 示 器 和 图 3-14 所 示 的 定时 器 电路 ， 写 一 个 ARM 程序 ， 显 示 重 
复 序列 0、1、2、…、98、99、0、… 中 的 数 ， 每 个 数 显 示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 


是 由 100 MHz 的 时 钟 驱动 的 。 

[D] D.34 写 一 个 ARM 程序 ， 计 算 实 时 时 钟 时 间 并 以 小 时 ( 0 ~ 23 ) 和 分 钟 (0 一 59 ) 的 形式 显示 时 间 。 
显示 器 包括 4 个 图 3-17 所 示 的 七 段 显示 设备 。 还 有 一 个 具有 图 3-14 所 示 接 口 的 定时 器 电路 ， 
其 计数 器 是 由 100 MHz 的 时 钟 驱动 的 。 

[M] D.35 写 一 个 ARM 程序 来 解决 第 3 章 中 例 3.5 所 描述 的 问题 。 
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[M] D.36 写 一 个 ARM 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 
[M] D.37 写 一 个 ARM 程序 来 解决 第 3 章 的 习题 3.19 中 的 问题 - 
[M] D.38 写 一 个 ARM 程序 来 解决 第 3 章 的 习题 3.21 中 的 问题 - 
[M] D.39 写 一 个 ARM 程序 来 解决 第 3 章 的 习题 3.23 中 的 问题 。 
[M] D.40 写 一 个 ARM 程序 来 解决 第 3 章 的 习题 3.25 中 的 问题 。 
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附录 目标 

在 本 附录 中 ， 你 将 学 习 Intel IA-32 体系 结构 的 特点 : 

e 存储 器 组 织 与 寄存 器 结构 

e@ 寻 址 方式 与 指令 类 型 

e 输入 /输出 能 力 

e 标量 浮 点 运算 

e 多 媒体 操作 

e 向 量 浮 点 运算 

Intel 公司 使 用 通用 名 称 Intel 体系 结构 (IA ) 来 命名 其 处 理 器 产品 系列 的 指令 集 。 我 们 
将 描述 处 理 器 的 IA-32 指令 集 ， 这 种 处 理 顺 使 用 32 位 的 存储 器 地 址 ， 能 处 理 32 位 的 操作 数 。 
IA-32 指令 集 是 非常 庞大 的 ， 除 了 提供 典型 的 整数 和 浮 点 数 指令 ， 它 还 包括 多 媒体 应 用 和 向 量 
数据 处 理 的 专用 指令 。 我 们 将 只 关注 基本 的 指令 和 寻 址 方式 。 参 考 文献 [1] 全 面 概述 了 IA-32 
体系 结构 ，Intel 的 网 站 (http:/www.intelcom ) 则 提供 了 一 些 更 详细 的 技术 文档 。 


E.1 存储 器 组 织 


在 IA-32 体系 结构 中 ， 存 储 器 采用 字 节 可 寻 址 的 32 位 地 址 ， 指 令 的 操作 数 通 常 是 8 位 或 
32 位 的 。 在 Intel 的 术语 中 ， 这 些 操作 数 的 大 小 被 称 为 字 节 (byte ) 或 双 字 ( doubleword )。16 
位 的 操作 数 在 早期 的 16 位 Intel 处 理 器 中 被 称 为 字 ( word )。 对 于 双 精 度 浮 点 数 和 打包 的 整数 
数据 ， 还 有 更 大 的 64 位 的 操作 数 大 小 ， 被 称 为 四 字 (quadword )。 这 里 使 用 的 是 2.1.2 节 中 描 
述 的 小 端 编 址 方式 。 多 字 节 的 数据 操作 数 可 以 在 任意 的 字 节 地 址 处 开始 ， 不 需要 在 存储 器 中 特 
定 的 地 址 边界 上 对 齐 。 


E.2 寄存 器 结构 


图 E-1 所 示 的 是 处 理 器 寄存 器 。 有 8 个 32 位 的 通用 寄存 器 ， 可 以 用 来 保存 整数 数据 或 寻 
址 信息 。 我 们 并 不 对 这 些 寄存 器 进行 连续 编号 ， 而 是 通过 唯一 的 名 称 来 标识 它们 ， 这 将 在 本 
节 后 面 进 行 介绍 。 另 外 ， 有 8 个 额外 的 寄存 器 可 用 于 浮 点 指令 ， 这 将 在 E.9 节 中 进行 讨论 。 这 
些 寄存 器 还 可 以 用 于 E.10 节 描 述 的 多 媒体 指令 。 还 有 另外 一 组 寄存 器 ， 在 图 E-1 中 尚未 列 出 ， 
这 些 寄存 器 可 被 E.11 节 中 讨论 的 向 量 处 理 指令 使 用 。 

IA-32 体系 结构 具有 不 同 的 存储 访问 模型 。 段 式 存储 模型 (segmented memory model ) 将 
称 为 段 (segment ) 的 不 同 存储 区 域 与 不 同 的 用 途 联系 在 一 起 。 代 码 段 (code segment ) 保存 程 
序 的 指令 ， 堆 栈 段 ( stack segment ) 包含 着 处 理 器 堆栈 ， 四 个 数据 段 (data segment ) 用 来 保存 
数据 操作 数 。 图 E-1 所 示 的 六 个 段 寄 存 器 保存 着 用 于 在 存储 器 地 址 空间 中 确定 这 些 段 起 始 位 置 
的 选择 器 值 。 这 些 寄存 器 的 具体 功能 在 本 附录 中 不 作 详细 讨论 。 本 附录 将 采用 IA-32 体系 结构 
的 平展 存储 模型 〈flat memory model )， 在 该 模型 中 ， 一 个 32 位 的 地 址 可 以 访问 代码 、 处 理 器 
堆栈 或 数据 区 域 中 的 任何 一 个 存储 单元 。 在 这 种 情况 下 ， 段 寄存 器 被 初始 化 为 指向 存储 器 中 地 
址 0 的 选择 器 值 。 
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图 E-1 IA-32 寄存 器 结构 


图 E-1 底部 所 示 的 两 个 寄存 器 是 指令 指针 和 状态 寄存 器 ， 其 中 指令 指针 作为 程序 计数 器 ， 
保存 着 下 一 条 将 要 执行 的 指令 地 址 ， 而 状态 寄存 器 保存 着 条 件 码 标志 (CF、ZF、SF、OF )， 
662| ”这些 标志 中 包含 有 关 算 术 运 算 的 结果 信息 。 程 序 执行 模式 位 (IOPL、 正 、TF ) 与 输入 /输出 操 
663| ” 作 和 中 断 相 关 。 
IA-32 的 通用 寄存 器 与 早期 的 8 位 和 16 位 Intel 处 理 器 寄存 器 保持 了 兼容 性 。 在 那些 处 理 
器 中 ， 某 些 寄 存 器 的 使 用 有 一 些 限 制 。 图 E-2 给 出 了 IA-32 寄存 器 与 早期 处 理 器 中 寄存 器 之 间 
的 关系 。8 个 通用 寄存 器 被 分 为 三 种 不 同 的 类 型 : 数据 寄存 器 用 来 保存 操作 数 ， 指 针 寄 存 器 用 
来 保存 地 址 ， 变 址 寄存 器 用 来 保存 变 址 地 址 。 指 针 和 变 址 寄存 器 用 来 确定 存储 器 操作 数 的 有 效 
地 址 。 
在 Intel 最 初 的 8 位 处 理 器 中 ， 数 据 寄 存 器 被 称 为 A、B、C 和 了 D。 在 后 来 的 16 位 处 理 器 
中 它们 被 标志 为 AX、BX、CX 和 DX。 每 个 寄存 器 中 的 高 位 字 节 和 低位 字 节 分 别 用 后 缀 H 和 
工 来 标识 。 例 如 ， 寄 存 器 AX 中 的 两 个 字 节 是 AH 和 AL。 在 IA-32 处 理 器 中 ,前 缀 E 用 来 标 
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识 相 应 的 可 扩展 32 位 寄存 器 : EAX、EBX、ECX 和 EDX。 前 级 标志 EE 还 可 以 用 于 图 E-2 所 
示 的 其 他 32 位 寄存 器 。 它 们 是 早期 处 理 器 中 相应 的 16 位 寄存 器 的 扩展 版 本 。 





31 16 15 87 0 
sx[ LT 
AX 






Cx 数据 寄存 器 


EFLAGS | | FAGS | 。 状态 霖 存 器 
图 E-2 IA-32 寄存 器 结构 与 早期 Intel 处 理 器 寄存 器 结构 的 兼容 性 


这 种 寄存 器 标志 在 Intel 的 技术 文档 [1] 以 及 Intel 处 理 器 的 其 他 描述 中 使 用 。 由 于 保持 历 
史 标 志 的 原因 ，Intel 在 它 的 处 理 器 系列 中 保持 了 向 上 兼容 的 特点 。 也 就 是 说 ， 为 早期 的 16 位 
处 理 器 编写 的 机 器 语言 程序 ， 只 要 IA-32 处 理 器 的 状态 设置 正确 ， 就 可 以 不 加 修改 地 在 目前 的 
IA-32 处 理 器 上 正确 运行 。 我 们 将 在 给 定 的 汇编 语言 程序 示例 中 ， 使 用 带 有 了 前缀 的 寄存 器 标 
志 ， 因 为 IA-32 处 理 器 汇编 语言 当前 版 本 中 使 用 的 就 是 这 些 助 记 符 。 当 字 节 操作 数 保存 在 相应 
的 32 位 寄存 器 中 的 低 八 位 时 ， 将 使 用 AL、BL 等 标志 。 


E.3 和 寻 址 方式 


IA-32 体系 结构 有 一 套 丰 富 且 灵活 的 寻 址 方式 。 它 们 既 可 以 访问 单个 数据 项 ， 也 可 以 访问 
从 一 个 指定 的 存储 器 地 址 开始 的 有 序列 表 数 据 项 。 基 本 的 寻 址 方式 与 大 多 数 处 理 器 的 寻 址 方 
式 相同 ， 如 2.4 节 所 述 。 它 们 是 : 立即 方式 、 绝 对 方式 、 寄 存 器 方式 和 寄存 器 间接 方式 。Intel 
使 用 直接 ( direct ) 方式 来 表示 绝对 方式 ， 所 以 在 这 里 我 们 也 采用 同样 的 方式 。 还 有 几 种 用 来 
访问 存储 器 中 数据 操作 数 的 更 加 灵活 的 寻 址 方式 。 在 2.4 节 中 描述 的 最 灵活 的 方式 就 是 变 址 方 
式 ， 这 种 方式 的 通用 记号 为 X(Ri, Rj)。 操 作 数 的 有 效 地 址 EA 计算 如 下 : 

EA= [Ri]+[R/]+X 

其 中 Ri 和 Rj 是 通用 寄存 器 , X 是 一 个 常量 。 寄 存 器 Ri 和 Rj 分别 被 称 为 基 址 (base ) 和 变 址 
(index ) 寄存 器 ， 常 量 X 被 称 为 位 移 量 ( displacement )。IA-32 寻 址 方式 中 包括 这 种 方式 和 该 
种 方式 的 更 简单 变种 形式 。 

IA-32 的 寻 址 方式 定义 如 下 : 

立即 方式 (immediate mode ) 一 一 操作 数 包含 在 指令 中 。 它 是 一 个 8 位 或 32 位 的 有 符号 
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数 ， 甚 长 度 用 指令 操作 码 中 的 一 位 来 指定 。 该 位 是 0 表示 短 版 本 ， 是 1 表示 长 版 本 。 

直接 方式 ( direct mode ) 操作 数 的 存储 器 地 址 是 由 指令 中 的 一 个 32 位 值 给 出 的 。 

寄存 器 方式 ( register mode ) 操作 数 包含 在 指令 中 指定 的 一 个 通用 寄存 器 中 。 

寄存 器 间接 方式 ( register indirect mode ) 操作 数 的 存储 器 地 址 包含 在 指令 中 指定 的 
一 个 通用 寄存 器 中 - 

带 有 位 移 量 的 基 址 方式 (base with displacement mode ) 指令 中 给 出 了 一 个 8 位 或 32 
位 的 有 符号 位 移 量 以 及 一 个 用 作 基 址 寄存 器 的 通用 寄存 器 。 操 作 数 的 有 效 地 址 是 基 址 寄存 器 的 
内 容 和 位 移 量 的 和 |. 

带 有 位 移 量 的 变 址 方式 (index with displacement mode) 指令 中 给 出 了 一 个 32 位 的 有 
符号 位 移 量 ， 一 个 用 作 变 址 寄存 器 的 通用 寄存 器 和 一 个 比例 因子 (1、2、4 或 8 )。 操 作 数 的 有 
效 地 址 是 变 址 寄存 器 的 内 容 乘 以 比例 因子 之 后 再 与 位 移 量 相 加 的 和 。 

带 有 变 址 的 基 址 方式 (base with index mode ) 指令 中 给 出 了 两 个 通用 寄存 器 和 一 个 比 
例 因 子 (1、2、4 或 8 )。 这 两 个 寄存 器 分 别 用 作 基 址 寄存 器 和 变 址 寄存 器 。 操 作 数 的 有 效 地 址 
是 变 址 寄存 器 的 内 容 乘 以 比例 因子 之 后 再 与 基 址 寄存 器 的 内 容 相 加 的 和 。 

带 有 变 址 和 位 移 量 的 基 址 方式 ( base with index and displacement mode) 指令 中 给 出 了 
一 个 8 位 或 32 位 的 有 符号 位 移 量 ， 两 个 通用 寄存 顺和 一 个 比例 因子 (1、2、4 或 8 )， 这 两 个 
寄存 器 分 别 用 作 基 址 寄存 器 和 变 址 寄存 器 。 操 作 数 的 有 效 地 址 是 变 址 寄存 器 的 内 容 乘 以 比例 因 
子 之 后 再 与 基 址 寄存 器 的 内 容 和 位 移 量 相 加 的 和 。 

IA-32 的 寻 址 方式 及 其 汇编 语言 的 表示 方式 在 表 E-1 中 给 出 。 表 中 还 给 出 了 操作 数 有 效 地 
址 的 计算 。 正 如 表 中 的 脚注 所 说 明 的 那样 ， 寄 存 器 ESP 不 能 用 作 变 址 寄存 器 ， 因 为 它 是 作为 
处 理 器 堆栈 指针 使 用 的 。 























表 E-1 1IA-32 寻 址 方式 


名 称 寻 址 功能 
立即 方式 Operand = Value 
直接 方式 EA = Location 
寄存 器 方式 | Rg | EA= Reg， 即 操作 数 = [Reg] 
寄存 器 间接 方式 EA= [Reg] 
带 有 位 移 量 的 基 址 方式 EA = [Reg] + Disp 
带 有 位 移 量 的 变 址 方式 EA= [Reg] x S+ Disp 
带 有 变 址 的 基 址 方式 EA= [Regl]+ [Reg2] x S 


带 有 变 址 和 位 移 量 的 基 址 方式 EA= [Regl] + [Reg2] x S + Disp 

Value=8 位 或 32 位 的 有 符号 数 

Location=32 位 的 地 址 

Reg, Regl, Reg2= 通用 寄存 器 EAX、EBX、ECX、EDX、ESP、EBP、ESI、EDI 中 的 一 个 ， 其 中 的 ESP 不 能 用 
作 变 址 寄存 器 

Disp= 8 位 或 32 位 的 有 符号 数 ， 在 带 有 位 移 量 的 变 址 方式 中 只 能 使 用 32 位 的 有 符号 数 

S= 比例 因子 1、2、4 或 8 


指令 可 以 有 0 个 、1 个 或 2 个 操作 数 。 在 双 操 作 数 指令 中 ， 源 操作 数 (src ) 和 目的 操作 数 
(dst ) 使 用 汇编 语言 指定 的 顺序 为 
OP dst, Src 
这 个 顺序 与 第 2 章 中 的 相同 。 
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使 用 Move 指令 来 说 明 IA-32 的 寻 址 方式 及 其 在 汇编 语言 中 的 标记 符号 (notation ) 是 非 

党 方便 的 ， 指 令 

MOV EAX,25 
将 十 进 制 数 值 25 传送 到 目的 寄存 器 EAX 中 ， 其 中 源 操作 数 使 用 立即 寻 址 方式 指定 ， 目 的 操作 
数 使 用 寄存 器 寻 址 方式 指定 。 

当 一 个 数字 常量 作为 一 个 操作 数 单独 出 现时 ， 它 就 表示 一 个 立即 数值 。 数 字 常 量 可 以 用 
数字 0 到 9 这 种 十 进 制 形式 来 表示 。 根 据 所 使 用 的 汇编 程序 ， 还 可 以 用 前 级 0x 或 后 级 H 来 表 
示 十 六 进 制 数 。 在 后 一 种 情况 中 ， 以 A 到 下 开头 的 数 还 需要 一 个 前 级 0， 这 样 汇编 程序 就 可 以 
将 一 个 十 六 进 制 数 和 一 个 标志 区 分 开 来 。 一 些 汇编 程序 还 允许 使 用 后 级 B 来 表示 二 进 制 数 。 

符号 名 也 可 以 当 作 操作 数 来 使 用 。 如 果 符 号 名 LOCATION 被 定义 为 一 个 地 址 标志 ， 则 
指令 

MOV EAX,LOCATION 
隐 式 地 使 用 直接 寻 址 方式 将 存储 地 址 LOCATION 处 的 双 字 传送 到 寄存 器 EAX 中 。 还 可 以 显 式 
地 使 用 直接 寻 址 方式 。 指 令 
MOV EAX,DWORD PTR LOCATION 

使 用 关键 字 DWORD PTR 来 表明 标志 LOCATION 应 该 被 解释 为 32 位 操作 数 的 地 址 。 

当 需 要 将 一 个 地 址 标志 当 作 一 个 立即 操作 数 来 处 理 时 ， 使 用 关键 字 OFFSET。 例 如 ， 指 令 

MOV EBX,OFFSETLOCATION 

使 用 立即 寻 址 方式 将 地 址 标志 LOCATION 的 值 传送 到 寄存 器 EBX 中 。 

一 旦 一 个 地 址 被 装 入 一 个 寄存 器 中 ， 就 可 以 使 用 寄存 器 间接 寻 址 方式 来 访问 存储 器 中 的 

MOV EAX, [EBX] 

将 地 址 包含 在 寄存 器 EBX 中 的 存储 单元 的 内 容 传 送 到 寄存 器 EAX 中 。 

以 上 例子 说 明了 基本 的 寻 址 方式 : 立即 、 直 接 、 寄 存 器 和 寄存 器 间接 方式 。 其 余 的 四 种 寻 
址 方式 在 访问 存储 器 中 的 数据 操作 数 时 提供 了 更 加 灵活 的 方式 。 

带 有 位 移 量 的 基 址 方式 在 图 E-3a 中 作 了 说 明 。 寄 存 器 EBP 被 用 作 基 址 寄存 器 。 位 于 地 址 
1060 ( 与 基地 址 1000 相距 60 字 节 ) 处 的 双 字 操作 数 可 由 以 下 指令 传送 到 寄存 器 EAX 中 : 

MOV EAX, [EBP+60] 

指令 可 以 对 字 节 操作 数 和 双 字 操作 数 进行 处 理 。 例 如 ， 还 是 假设 基 址 寄存 器 EBP 中 的 地 

址 是 1000， 可 以 使 用 指令 

MOV AL, [EBP+10] 
将 地 址 1010 处 的 字 节 操作 数 装 入 EAX 寄存 器 的 低 字 节 部 分 。 由 于 目的 操作 数 AL 是 EAX 寄 
存 器 的 低 字 节 部 分 ， 所 以 汇编 程序 选择 用 于 字 节 数据 的 Move 操作 码 版 本 。 

最 灵活 的 寻 址 方式 就 是 带 有 变 址 和 位 移 量 的 基 址 方式 ， 图 E-3b 给 出 了 一 个 例子 ， 其 中 
使 用 EBP 和 ESI 作为 基 址 和 变 址 寄存 器 。 这 个 例子 展示 了 如 何 使 用 这 种 方式 去 访问 双 字 操作 
数列 表 中 的 一 个 双 字 操作 数 。 该 列表 在 与 基地 址 1000 相距 200 的 地 方 开始 。 对 变 址 寄存 器 
中 的 内 容 使 用 比例 因子 4， 就 可 以 使 用 变 址 寄存 器 ESI 中 的 变 址 序列 0，1，2，… 来 访问 地 址 
1200, 1204, 1208, … 处 的 连续 双 字 操作 数 。 在 该 图 所 示 的 例子 中 ， 当 变 址 寄存 器 的 值 为 40 时 ， 
就 访问 地 址 1360 ( 也 就 是 1000 + 200 +4 x 40 ) 处 的 双 字 。 这 个 操作 数 可 通过 指令 

MOV EAX,[EBP+ESI*4+200] 
装 入 寄存 器 EAX 中 。 在 这 种 寻 址 方式 中 使 用 比例 因子 4， 可 使 得 在 一 个 程序 循环 中 访问 列表 
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中 的 连续 双 字 操作 数 更 加 容易 ， 只 需 在 每 遍 循 环 中 简单 地 将 变 址 寄存 器 的 值 递 增 1 即 可 。 在 对 
这 两 种 方式 作 了 比较 详细 的 讨论 之 后 ， 与 其 密切 相关 的 带 位 移 量 的 变 址 方式 和 带 变 址 的 基 址 方 
式 将 会 很 容易 理解 了 。 

主 存 地 址 


基 址 寄存 器 EBP 


1060 





操作 数 地 址 (EA) = [EBP] + 60 


a ) 带 有 位 移 量 的 基 址 方式 ， 表 示 为 [EBP+ 60] 


基 址 寄存 器 EBP 


2 变 址 寄存 器 ESI 
200 = 位 移 量 
4 字 节 ( 双 sn 
字 ) 数据 项 y 160 = [ 变 址 寄存 器 ] x 4 
列表 小 


1360 操作 数 


操作 数 地 址 (EA) = [EBP] + [ESD x 4 + 200 
b ) 带 有 位 移 量 和 变 址 的 基 址 方式 ， 表 示 为 [EBP + ESI* 4 + 200] 
图 E-3 IA-32 体系 结构 中 寻 址 方式 举例 


在 结束 寻 址 方式 的 讨论 之 前 ， 对 表 E-1 中 所 描述 的 两 种 方式 进行 注释 是 很 有 用 的 。 带 有 位 
移 量 的 基 址 方式 看 起 来 是 多 余 的 ， 因 为 通过 带 有 位 移 量 的 变 址 方式 〈 比例 因子 为 1 ) 可 以 实现 
同样 的 效果 。 但 是 前 一 种 方式 可 以 编码 在 一 个 字 节 之 中 ， 所 以 是 很 有 用 的 。 此 外 ， 带 有 位 移 量 
的 变 址 方式 中 的 位 移 量 只 能 是 32 位 的 ， 而 带 有 位 移 量 的 基 址 方式 中 的 位 移 量 还 可 以 是 8 位 的 。 


E.4 指令 


IA-32 的 指令 集 是 很 庞大 的 。 它 可 以 按照 可 变 长 度 的 指令 格式 进行 编码 ， 而 无 需 使 用 完 
规则 的 编码 方案 。 大 多 数 指令 都 有 一 个 或 两 个 操作 数 。 在 双 操 作 数 的 情况 下 ， 只 能 有 一 个 操作 
数 在 存储 器 中 。 另 外 一 个 操作 数 必须 在 处 理 器 寄存 器 中 或 者 是 指令 中 指定 的 一 个 立即 数 。 指 令 
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集中 提供 了 在 存储 器 与 处 理 器 寄存 器 之 间 传 送 数据 的 指令 ， 执 行 算术 运算 和 逮 辑 运算 的 指令 ， 
以 及 移 位 / 循环 移 位 操作 的 指令 。 此 外 还 包括 Jump ( 跳 转 ) 指令 和 子 程序 调用 /返回 指令 ， 并 
直接 支持 对 处 理 器 堆栈 进行 的 Push ( 压 栈 ) 和 Pop (弹出 ) 操作 。 
E.4.1 机 器 指令 格式 

机 器 指令 的 一 般 格式 如 图 E-4 所 示 。 指 令 是 可 变 长 的 ， 变 化 的 范围 从 1 到 12 字 节 ， 由 四 
个 字段 构成 。 操 作 码 字段 由 一 个 或 两 个 字 节 构成 ， 大 多 数 指令 只 需要 一 个 字 节 。 紧 跟 在 操作 码 
字段 之 后 需要 用 一 到 两 个 字 节 保存 寻 址 方式 信息 。 





1 或 2 个 字 节 1 或 2 个 字 节 1 或 4 个 字 节 1 或 4 个 字 节 
图 E-4 IA-32 指令 格式 


对 于 只 使 用 一 个 寄存 器 来 产生 存储 器 操作 数 有 效 地 址 的 指令 ， 寻 址 方式 字段 只 需要 一 个 
字 节 。 表 E-1 中 最 后 两 种 寻 址 方式 的 编码 则 需要 两 个 字 节 ， 这 些 方式 使 用 两 个 寄存 器 来 产生 存 
储 器 操作 数 的 有 效 地 址 。 

如 果 在 计算 存储 器 操作 数 有 效 地 址 的 过 程 中 需要 使 用 一 个 位 移 量 ， 那 么 这 个 位 移 量 就 用 
一 个 或 四 个 字 节 进行 编码 ， 并 放 在 紧 跟着 寻 址 方式 字段 之 后 的 字段 中 。 如 果 其 中 一 个 操作 数 是 
立即 数 ， 那 么 它 被 放 在 指令 的 最 后 一 个 字段 中 ， 占 用 一 个 或 四 个 字 节 。 

一 些 简单 的 指令 ， 如 将 寄存 器 自 增 或 自 减 的 指令 ， 只 占用 一 个 字 节 。 例 如 ， 指 令 

INC EDI 

将 寄存 器 EDI 的 值 增加 1。 在 这 种 情况 下 ， 寄 存 器 操作 数 通 过 操作 码 字 节 中 的 3 位 编码 来 指定 。 
然而 ,对 于 大 多 数 的 指令 和 寻 址 方式 来 说 ， 所 使 用 的 寄存 名 都 是 在 寻 址 方式 字段 中 指定 的 。 


E.4.2 汇编 语言 符号 

汇编 语言 符号 的 部 分 内 容 已 经 在 E.3 节 的 寻 址 方式 中 作 过 介绍 。 本 节 将 总 结 所 使 用 的 符 
号 ， 以 及 汇编 语言 中 的 地 址 、 立 即 值 、 操 作 数 大 小 以 及 大 写字 符 的 使 用 等 细节 。 

操作 数 名 称 之 前 的 关键 字 DWORD PTR 表示 该 名 称 是 一 个 32 位 操作 数 的 地 址 。 同 样 ， 操 
作 数 名 称 之 前 的 关键 字 BYTE PTR 表示 该 名 称 是 一 个 8 位 操作 数 的 地 址 。 另 一 方面 ， 名 称 之 
前 的 关键 字 OFFSET 表示 该 名 称 是 一 个 立即 值 。 

每 一 条 汇编 语言 指令 都 必须 包含 足够 的 信息 ， 以 便于 汇编 程序 确定 操作 数 的 大 小 。 在 寄 
存 器 寻 址 方式 中 ， 寄 存 器 的 名 称 提 供 了 必要 的 信息 。 例 如 ， 作 为 指令 操作 数 的 寄存 器 EAX 表 
示 操 作 数 的 大 小 为 32 位 ， 而 寄存 器 AL 则 表示 操作 数 的 大 小 是 8 位 的 。 汇 编程 序 能 够 生成 与 
操作 数 大 小 相对 应 的 操作 码 。 

在 不 包含 寄存 器 寻 址 方式 的 情况 下 ， 汇 编程 序 需要 额外 的 信息 。 例 如 ， 单 操作 数 指令 可 
通过 使 用 间接 寻 址 方式 或 位 移 量 寻 址 方式 来 指定 存储 器 操作 数 。 为 了 指明 操作 数 的 大 小 ， 需 要 
包含 关键 字 DWORD PTR 或 BYTE PTR。 

许多 IA-32 汇编 程序 对 指令 助 记 符 和 寄存 器 名 称 是 不 区 分 大 小 写 的 。Intel 的 技术 文档 则 一 
贯 使 用 大 写字 符 [1]。 为 了 符合 这 种 描述 风格 ， 我 们 对 所 有 的 指令 助 记 符 和 寄存 器 名 称 都 使 用 
大 写字 符 。 
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E.4.3 ”Move 指令 

MOV 指令 在 存储 器 或 VO 接口 和 处 理 器 寄存 器 之 间 传 送 数据 。 数 据 传 送 的 方向 是 从 源 端 
到 目的 端 。 状 态 寄 存 器 中 的 条 件 码 标志 不 受 MOYV 指令 执行 的 影响 。 

E.3 节 中 的 例子 显示 了 MOYV 指令 是 如 何 将 数据 从 存储 器 传送 到 寄存 器 的 。 寄 存 器 中 的 内 
容 同样 也 可 以 传送 到 存储 器 或 者 其 他 的 寄存 右 中 。 指 令 

MOV LOCATION, ECX 
将 寄存 器 ECX 中 的 双 字 传送 到 地 址 为 LOCATION 的 存储 单元 中 。 指 令 
MOV EBP,EDI 

将 寄存 器 EDI 中 的 双 字 传送 到 寄存 器 EBP 中 ， 而 寄存 器 EDI 中 的 值 保 持 不 变 。 

MOYV 指令 不 能 对 两 个 存储 器 操作 数 进 行 操作 ， 但 它 可 以 将 一 个 立即 数 传送 到 一 个 存储 单 
元 中 ， 如 

MOV DWORD PTR [EAX+16], 100 

需要 注意 的 是 ， 汇 编程 序 要 求 使 用 关键 字 DWORD PTR (或 BYTE PTR ) 来 指明 指令 中 的 操作 
数 大 小 。 


E.4.4 ”加 载 有 效 地 址 ( Load-Effective-Address ) 指令 


E.3 节 描 述 了 MOY 指令 是 如 何 使 用 关键 字 OFFSET 来 将 一 个 地 址 装 入 寄存 器 中 的 。 指 令 
LEA ( Load-effective-address ) 同样 可 以 实现 这 个 功能 。 例 如 ， 如 果 LOCATION 被 定义 为 一 个 
地 址 标志 ， 则 指令 

LEA EAX,LOCATION 
与 
MOV EAX,OFFSET LOCATION 
具有 完全 相同 的 效果 。 

LEA 指令 可 用 来 加 载 执行 过 程 中 所 计算 出 的 有 效 地 址 。 例 如 ， 假 设 需 要 使 用 寄存 器 EBX 
作为 指向 存储 器 中 数据 操作 数 的 指针 ， 还 假设 所 需 的 操作 数 是 数组 中 的 一 个 元 素 ， 该 元 素 位 于 
从 数组 起 始 位 置 偏 移 12 个 字 节 的 地 方 。 如 果 寄 存 器 EBP 中 保存 了 数组 的 起 始 地 址 ， 那 么 指令 

LEA EBX, [EBP+12] 
计算 所 需 的 有 效 地 址 ， 并 将 其 保存 在 寄存 器 EBX 中 。 然 后 ， 该 操作 数 便 能 被 Move 指令 或 其 
他 指令 通过 使 用 EBX 寄存 器 的 寄存 器 间接 寻 址 方式 进行 访问 。 


E.4.5 算术 指令 
这 一 类 的 指令 包括 算术 运算 以 及 比较 运算 和 求 反 运算 。 操 作 数 可 以 放 在 存储 器 中 ， 也 可 
以 放 在 寄存 器 中 ， 或 者 被 指定 为 立即 值 ( 双 操 作 数 指令 )。 操 作 数 的 大 小 可 以 是 双 字 或 者 字 节 。 
1. 加 法 、 减 法 、 比 较 和 求 反 运算 
双 操作 数 的 算术 指令 有 : 
ADD (加 法 ) 
ADC ( 带 进位 的 加 法 ， 适 用 于 多 精度 的 算术 运算 ) 
SUB (减法 ) 
SBB( 带 借 位 的 减法 ,适用 于 多 精度 的 算术 运算 ) 
CMP ( 比较 ， 目 的 操作 数 的 值 保持 不 变 ) 
根据 所 执行 运算 的 结果 ， 这 些 指令 会 影响 所 有 的 条 件 码 标志 。 指 令 
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ADD EAX,EBX 


执行 32 位 运算 
EAX «~ [EAX] + [EBX] 
指令 
CMP [EBX+10],AL 
执行 8 位 运算 


[[EBX] + 10] - [AL] 
使 用 寄存 器 AL 意味 着 操作 数 的 大 小 是 1 字 节 。 根 据 减法 运算 是 否 有 溢出 或 进位 、 运 算 结 果 是 
否 为 负数 或 者 零 来 对 条 件 码 标志 进行 设置 。 减 法 运算 的 结果 将 被 丢弃 。 

单 操作 数 的 算术 指令 有 : 

e INC ( 自 增 ) 

e DEC ( 自 减 ) 

e NEG ( 求 反 ) 

NEG 指令 会 影响 所 有 的 条 件 码 标志 ， 但 INC 和 DEC 指令 则 不 会 影响 CF 标志 。 这 些 指令 
都 必须 包含 关键 字 来 指明 操作 数 的 大 小 ， 除 非 操 作 数 使 用 的 是 寄存 器 寻 址 方式 。 指 令 

INC DWORD PTR [EDX] 
使 得 地 址 在 寄存 器 EDX 中 的 存储 单元 内 的 双 字 自 增 1。 

2. 乘法 

有 符号 整数 的 乘法 指令 IMUL 执行 32 位 乘法 运算 。 根 据 所 使 用 的 指令 形式 ， 目 的 操作 数 
可 以 是 隐 含 的 ，64 位 的 乘积 可 以 被 截取 为 32 位 。 

该 指令 的 一 种 形式 是 

IMUL src 
它 隐 含 地 使 用 EAX 寄存 器 作为 被 乘 数 。 由 src 指定 的 乘 数 可 以 放 在 寄存 器 中 也 可 以 放 在 存储 
器 中 。 完 整 的 64 位 乘积 可 以 保存 在 寄存 器 EDX (高 32 位 ) 和 EAX ( 低 32 位 ) 中。 
该 指令 的 第 二 种 形式 是 
IMUL REG, src 
目的 操作 数 REG 必须 是 一 个 通用 寄存 器 。 源 操作 数 可 以 放 在 寄存 器 中 也 可 以 放 在 存储 器 中 。 
在 将 乘积 放 到 目的 寄存 器 之 前 要 将 其 截取 为 32 位 。 

对 于 这 两 种 形式 ， 如 果 64 位 乘积 的 高 32 位 中 有 一 个 1 (包括 符号 位 )， 那 么 就 会 对 CF 和 
OF 标志 进行 设置 ， 和 否则 CF 和 OF 将 被 清 零 。 其 他 的 标志 位 是 不 确定 的 。 

3. 除法 

整数 除法 指令 IDIV 对 64 位 的 被 除数 和 32 位 的 除数 进行 操作 ， 生 成 32 位 的 商 和 32 位 的 
余数 。 该 指令 的 格式 是 

IDIV src 
其 中 源 操作 数 是 除数 。64 位 的 被 除数 是 由 寄存 器 EDX (高 32 位 ) 和 EAX( 低 32 位 ) 中 的 内 
容 组 成 的 。 执 行 完 除法 运算 后 ， 商 被 放 入 EAX 中 而 余数 则 被 放 人 EDX 中 。 所 有 的 条 件 码 标 
志 都 是 不 确定 的 。 除 零 操作 会 导致 异常 。 

如 果 被 除数 是 用 32 位 来 表示 的 ， 那 么 它 必 须 先 被 放 入 EAX 寄存 器 中 ， 然 后 再 被 符号 扩 
展 为 所 需 的 64 位 操作 数 大 小 ， 放 在 寄存 器 EAX 和 EDX 中 。 这 是 通过 指令 CDQ ( 将 双 字 转换 
为 四 字 ) 来 完成 的 ， 该 指令 没有 操作 数 ， 因 为 其 源 操 作 数 和 目的 操作 数 被 隐 含 地 指定 为 寄存 器 
EAX 和 EDX。 
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E.4.6 ”Jump 指令 和 Loop 指令 

在 IA-32 的 术语 中 ， 所 有 的 转移 指令 都 被 称 作 Jump ( 跳 转 )， 这 包括 条 件 跳 转 和 无 条 件 跳 
转 指令 。 这 些 指 令 可 用 来 实现 循环 。 通 常情 况 下 ， 计 数 器 变量 在 每 次 通过 循环 的 时 候 递 减 ， 同 
时 条 件 跳 转 指令 检查 计数 是 否 仍 大 于 零 ， 以 便 决 定 是 否 执行 更 多 次 的 循环 。 因 为 这 种 方法 是 很 
常见 的 ， 所 以 有 一 条 特殊 的 Loop 指令 可 以 将 递减 和 条 件 跳 转 操作 结合 起 来 。 

1. 条 件 跳 转 指令 与 条 件 码 标志 

条 件 跳 转 指令 检测 状态 寄存 器 中 的 四 个 条 件 码 标志 。 指 令 

JG LABEL 
是 条 件 跳 转 指令 的 一 个 例子 。 跳 转 的 条 件 是 大 于 ( greater-than )， 在 操作 码 中 用 后 级 G 表示 。 
表 E-2 总 结 了 条 件 跳 转 指 令 以 及 相应 的 要 检测 的 条 件 码 标志 组 合 。 当 前 面 一 条 算术 或 比较 指令 
的 操作 数 是 有 符号 数 时 ， 将 使 用 可 以 检测 符号 标志 (SF ) 的 Jump 指令 。 例 如 ， 当 涉及 有 符号 
数 时 ，JG 指令 就 进行 大 于 条 件 的 测试 ， 并 考虑 SF 标志 。 对 于 无 符号 数 ，JA (jump-above ) 指 
令 检 测 大 于 条 件 ， 但 并 不 考虑 SF 标志 。 
表 E-2 ”IA-32 条 件 跳 转 指令 








助 记 符 条 件 检测 
Ns SF 

JE/JZ 相等 /为 0 ZF=1 

IO | oF-=1 

mo of 

JNC/JAE 无 进位 / 无 符号 大 于 或 等 于 CF=0 

JBE | 无 符号 小 于 或 等 于 CF V ZF=1 

JGE 有 符号 大 于 或 等 于 SF@OF=0 

JG ZF V (SF ® OF) -0 
JLE ZF V (SF ® OF)=1 


当 汇 编程 序 生成 机 器 码 时 ， 条 件 跳 转 指令 使 用 与 紧 跟 Jump 指令 之 后 那 条 指令 的 地 址 相关 
的 偏 移 量 进 行 编码 。 该 地 址 反映 了 提取 Jump 指令 后 指令 指针 ( Instruction Pointer ) 被 更 新 后 的 
内 容 。 如 果 偏 移 量 在 -128 到 +127 的 范围 内 ， 那 么 单个 字 节 就 足够 了 ， 这 时 ， 对 条 件 跳 转 指令 
进行 编码 的 字 节 总 数 就 是 两 个 字 节 ， 包 括 操作 码 字 节 。 当 跳 转 目标 的 距离 超出 这 个 范围 时 ， 就 
要 使 用 四 个 字 节 的 偏 移 量 ， 

2. 无 条 件 跳 转 指令 

无 条 件 跳 转 指令 JMP 会 产生 一 个 到 目标 地 址 处 指令 的 转移 。 除 了 使 用 短 〈 一 个 字 节 ) 或 
长 〈 四 个 字 节 ) 的 相对 有 符号 偏 移 量 来 确定 目标 地 址 以 外 ， 像 在 条 件 跳 转 指令 中 一 样 ，JMP 指 
令 也 可 以 使 用 其 他 的 寻 址 方式 。 这 种 灵活 性 在 产生 目标 地 址 时 是 非常 有 用 的 。 考 虑 一 下 很 多 高 
级 语言 中 的 Case 语句 。 在 程序 中 的 某 处 ， 可 以 使 用 Case 语句 来 从 很 多 可 供 选 择 的 计算 中 选择 
一 个 来 执行 ， 其 中 每 一 个 选择 都 被 认为 是 一 种 情况 。 假 设 对 于 每 一 种 情况 ， 都 定义 一 个 程序 去 
执行 相应 的 计算 。 同 样 也 假设 这 些 程序 的 4 字 节 起 始 地 址 保存 在 存储 器 内 的 一 张 表 中 ， 该 表 的 
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起 始 位 置 是 JUMPTABLE。 用 0、1、2、… 来 对 这 些 情况 进行 编号 。 在 程序 执行 过 程 中 ， 所 选 
情况 的 编号 被 装 人 变 址 寄存 器 ESI 中 。 通 过 执行 指令 
JMP [JUMPTABLE +ESI*4] 
就 可 跳 转 到 所 选择 情况 对 应 的 程序 中 ， 该 指令 使 用 的 是 带 位 移 量 的 变 址 寻 址 方式 。 
3. 循环 指令 
循环 通常 依赖 于 一 个 计数 器 变量 ， 该 计数 器 变量 在 每 一 轮 循环 中 减 1。 将 该 变量 保存 在 寄 
存 器 中 可 减少 执行 时 间 。 当 一 条 将 寄存 器 中 计数 器 减 1 的 指令 影响 条 件 码 标志 时 ， 在 条 件 转移 
指令 之 前 不 需要 进行 显 式 地 比较 。 一 个 循环 可 以 实现 如 下 : 
MOV ECX,NUM PASSES 
START: 


DEC ECX 
JG START 
这 种 形式 的 循环 可 以 通过 LOOP 指令 来 用 更 简洁 的 方式 表示 。 它 结合 了 DEC 和 JG 指令 的 功 
能 ， 并 隐 含 地 使 用 寄存 器 ECX 作为 计数 器 变量 。 使 用 这 条 指令 ,循环 可 以 实现 如 下 : 
MOV ECX, NUM PASSES 
START: 


LOOP START 

LOOP 指令 不 会 影响 条 件 码 标志 。 

使 用 目前 为 止 所 介绍 过 的 指令 ， 现 在 我 们 可 以 给 出 一 个 使 用 循环 将 数字 相 加 的 程序 了 ， 
该 程序 与 图 2-26 中 的 程序 类 似 。 假 设 存储 单元 N 中 保存 了 一 个 列表 中 32 位 整数 的 个 数 ， 而 该 
列表 在 存储 器 中 的 起 始 地 址 是 NUM1。 图 E-5a 所 示 的 汇编 语言 程序 将 这 些 数 相 加 ， 并 将 它们 
相 加 的 和 放 到 存储 单元 SUM 中 。 

寄存 器 EBX 中 保存 着 地 址 值 NUM1。 在 STARTADD 处 的 指令 (该 循环 的 第 一 条 指令 ) 
中 ， 寄 存 器 EBX 被 用 作 带 有 变 址 的 基 址 寻 址 方式 中 的 基 址 寄存 器 ， 寄 存 器 EDI 被 用 作 变 址 寄 
存 器 ， 在 进入 循环 之 前 它 被 清 为 零 。 在 第 一 遍 循环 中 ， 地 址 NUMI1 处 的 第 一 个 数 被 加 到 初 值 
为 0 的 EAX 寄存 器 中 ， 之 后 变 址 寄存 器 增加 1。 在 第 二 遍 循 环 中 ，ADD 指令 中 的 比例 因子 4 
将 使 得 地 址 NUMI1 + 4 处 的 第 二 个 32 位 数 被 加 到 EAX 中 。 在 后 续 的 循环 中 ， 地 址 NUMI1 + 
8、NUMI1 + 12、… 处 的 数 也 被 加 到 EAX 中 。 寄 存 器 ECX 被 用 作 计 数 寄存 器 。 该 寄存 器 最 初 
由 程序 的 第 二 条 指令 将 存储 单元 N 中 的 内 容 装载 到 其 中 ， 并 在 每 遍 循环 中 减 1。 当 [ECX] > 0 
时 ， 条 件 转移 指令 JG 将 使 得 程序 转移 回 到 STARTADD 处 。 当 ECX 的 内 容 达 到 0 时 ， 全 部 
的 数 都 已 经 相 加 完毕 。 不 再 执行 转移 ， 而 是 用 MOYV 指令 将 寄存 器 EAX 中 的 和 写 到 存储 单元 
SUM 中 。 

观察 图 E-5a 中 的 程序 ， 我 们 可 以 为 这 个 任务 编写 一 个 更 简洁 的 程序 。 观 察 的 第 一 点 是 两 
条 指令 的 序列 

DEC ECX 
JG STARADD 
可 由 如 下 这 一 条 指令 替代 : 
LOOP STARADD 
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STARTADD: 


EBX,NUMI1 

ECX.N 

EAX,0 

EDI, 0 

EAX, [EBX + EDI * 4] 


将 EBX 用 作 基 址 寄存 器 
将 ECX 用 作 计 数 寄存 器 
将 EAX 用 作 累 加 器 

将 EDI 用 作 变 址 寄存 器 
将 下 一 个 数 加 到 EAX 中 


EDI 变 址 寄存 器 增 1 

ECX 计数 寄存 器 减 1 

STARTADD 如 果 [ECX] > 0， 则 转移 返回 
SUM. EAX 将 和 保存 到 存储 器 中 





a ) 直接 方法 


EBX, NUMI 载 人 基 址 寄存 器 EBX 并 进行 
EBX, 4 调整 使 其 保存 NUM1 -4 
ECX, N 初始 化 计数 / 变 址 寄存 器 ECX 
EAX,0 将 EAX 用 作 累 加 器 
EAX, [EBX + ECX * 4] 将 下 一 个 数 加 到 EAX 中 
STARTADD ECX 减 1， 如 果 [ECX] > 0， 
则 转移 返回 

将 和 保存 到 存储 器 中 


STARTADD: 


SUM, EAX 





b ) 更 简洁 的 程序 
图 E-5 图 2-26 中 程序 的 实现 


该 指令 将 ECX 寄存 器 减 1， 之 后 如 果 ECX 的 内 容 还 没有 达到 0， 就 转移 到 目标 地 址 
STARTADD 处 。 观 察 的 第 二 点 就 是 使 用 了 两 个 寄存 器 EDI 和 ECX 作为 计数 器 。 如 果 我 们 反 
向 扫描 所 要 相 加 的 数字 列表 ， 即 从 列表 的 最 后 一 个 数 开 始 ， 则 只 需 使 用 一 个 计数 寄存 器 。 由 于 
寄存 器 ECX 是 LOOP 指令 隐 含 引用 的 寄存 器 ， 所 以 我 们 使 用 该 寄存 器 。 假 设 [N] = n， 当 EDI 
中 包含 的 值 序列 是 0、1、2、…、(n-1) 时 ， 第 一 个 程序 就 使 用 地 址 序列 NUM1、NUMI1+4、 
NUMI1+8、…、NUM1+4(n-1) 来 访问 这 些 数 。 新 程序 如 图 E-5b 所 示 ， 当 ECX 中 包含 的 值 序 
列 是 n、n-1、…、1 时 ,该 程序 使 用 的 地 址 序列 是 (NUM1-4)+4n、(NUM1-4)+4(n-1)、…、 
(NUM1-4)+4(1)。 因 此 ， 为 了 解决 EDI 序列 与 ECX 序列 之 间 的 不 同 ， 要 将 新 程序 的 基 址 寄存 
器 EBX 中 的 值 从 NUMI 改 成 NUM1-4。 在 新 程序 的 最 后 一 遍 循环 中 ， 执 行 LOOP 指令 之 前 ， 
[ECX] = 1， 最 后 一 个 要 相 加 的 数 在 存储 单元 NUMI1 中 。 

图 2-11 中 的 程序 计算 了 一 组 学 生 所 参与 的 三 项 测验 的 所 有 分 数 之 和 。 在 程序 中 使 用 Load 
指令 来 从 存储 器 中 提取 操作 数 。 图 E-6 给 出 了 该 程序 的 IA-32 版 本 。ADD 指令 中 可 以 使 用 带 
有 位 移 量 的 基 址 寻 址 方式 ， 这 样 ， 我 们 就 不 必 使 用 单独 的 指令 去 访问 存储 器 操作 数 。 

EAX, OFFSET LIST ”获取 地 址 LIST 
EBX,0 
ECX, 0 
EDX, 0 
EDI, N 加 载 n 值 。 
EBX, [EAX + 4] 加 上 当前 学 生 的 测验 1 成 绩 
ECX, [EAX + 8] 加 上 当前 学 生 的 测验 2 成 绩 
EDX., [EAX + 12] 加 上 当前 学 生 的 测验 3 成 绩 
EAX, 16 递增 指针 
EDI 递减 计数 器 
LOOP 如 果 没 完成 就 循环 回 到 前 面 
SUM1, EBX 保存 测验 1 的 总 和 
SUM2, ECX 
SUM3, EDX 


保存 测验 2 的 总 和 
保存 测验 3 的 总 和 





图 E-6 图 2-11 中 程序 的 实现 
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E.4.7 逻辑 指令 

IA-32 体系 结构 中 有 执行 逻辑 与 、 或 和 异 或 操作 的 指令 。 这 种 指令 对 两 个 操作 数 进行 位 操 
作 ， 并 将 结果 保存 在 目的 单元 中 。 例 如 ， 假 设 寄存 器 EAX 中 的 值 是 十 六 进 制 数 0000FFFF， 寄 
存 器 EBX 的 值 是 02FA62CA。 指 令 

AND EBX,EAX 

将 EBX 的 左 半 部 分 全 部 清 为 0， 右 半 部 分 保持 不 变 。 结 果 放 在 EBX 中 ,是 000062CA。 

指令 集中 还 有 一 条 NOT 指令 ， 它 对 操作 数 的 所 有 位 进行 逻辑 求 反 ， 也 就 是 将 全 部 的 1 变 
成 0， 全 部 的 0 变 成 1。 


E.4.8 ” 移 位 和 循环 移 位 指令 

利用 逻辑 移 位 或 算术 移 位 可 以 将 一 个 操作 数 左 移 或 右 移 ， 移 位 的 位 数 由 一 个 给 定 的 数值 
确定 。 移 位 指令 的 格式 是 

OP dst, count 

其 中 要 被 移 位 的 目的 操作 数 可 使 用 任意 一 种 寻 址 方式 指定 ，count 可 以 用 一 个 8 位 的 立即 数 给 
出 ， 也 可 以 放 在 一 个 8 位 的 寄存 器 CL 中 。 共 有 四 条 移 位 指令 : 

e SHL (逻辑 左 移 ) 

e。 SHR (逻辑 右 移 ) 

e。SAL (算术 左 移 ; 其 操作 等 同 于 SHL ) 

e。 SAR (算术 右 移 ) 
移 位 操作 已 在 2.8.2 节 中 作 过 讨论 ， 并 在 图 2-23 中 进行 了 展示 。 

除了 移 位 指令 之 外 ， 还 有 四 条 循环 移 位 指令 : 

e ROL (不 带 进位 标志 CF 的 循环 左 移 ) 

e。 ROR (不 带 进位 标志 CF 的 循环 右 移 ) 

e RCL ( 带 进位 标志 CF 的 循环 左 移 ) 

e RCR ( 带 进 位 标志 CF 的 循环 右 移 ) 
所 有 这 四 种 操作 已 在 图 2-25 中 做 了 说 明 。 循 
环 移 位 指令 要 求 count 参数 是 一 个 8 位 的 立即 ER 


六 AL, [EBP] 将 第 一 个 字 节 装 人 AL 中 
数 或 者 是 寄存 器 CL 中 的 一 个 8 位 值 。 AL,4 人 
BL, [EBP+1] 二 个 字 : BL 
例 E3 BL, OFH 将 高 4 位 清 零 
考虑 图 2-24 所 示 的 BCD 数字 打包 程序 ， AL, BL 连接 BCD 数字 


PACKED, AL 保存 结果 


程序 中 使 用 了 移 位 指令 和 逻辑 指令 。 该 程序 的 
IA-32 代码 如 图 E-7 所 示 。 将 两 个 ASCII 码 字 ”图 E-7 将 两 个 BCD 数字 打包 成 一 个 字 节 的 程序 ， 
节 装 入 寄存 器 AL 和 BL 中 。SHL 指令 将 AL 对 应 于 图 2-24 

中 的 字 节 左 移 四 位 ， 低 四 位 用 0 填充 。AND 指令 将 第 二 个 字 节 的 高 四 位 置 0。 最 后 ,使 用 OR 
指令 将 所 期 望 的 4 位 形式 的 BCD 码 合并 到 AL 中 ， 之 后 再 将 合并 的 结果 保存 到 存储 器 的 字 节 
单元 PACKED 中 。 


E.4.9 子 程序 链接 指令 
2.7 节 描 述 了 处 理 器 堆栈 在 子 程序 链接 中 的 使 用 。 在 IA-32 体系 结构 中 ， 寄 存 器 ESP 被 用 
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作 堆 栈 指 针 ， 指 向 处 理 器 堆栈 的 当前 栈 顶 元 素 (TOS )。 堆 栈 的 增长 方向 是 存储 器 地 址 的 低地 
址 方向 。 堆 栈 的 宽度 是 32 位 ， 也 就 是 说 ， 所 有 的 堆栈 项 都 是 双 字 的 。 
有 两 条 指令 用 来 将 单个 元 素 压 人 堆栈 和 从 堆栈 中 弹出 。 指 令 
PUSH Src 
将 ESP 中 的 值 减 4， 然 后 将 src 处 的 双 字 保存 到 ESP 所 指向 的 存储 单元 中 。 
POP dst 
ee 它 释 放 ESP 所 指向 的 TOS 处 的 双 字 ,将 其 保存 在 dst 处 ， 然 后 将 ESP 的 值 加 
。 这 些 指令 隐 含 地 将 ESP 作为 堆栈 指针 。 源 操作 数 和 目的 操作 数 采 用 IA-32 寻 址 方式 来 指定 。 
此 外 ， 还 有 两 条 指令 可 以 用 来 将 多 个 寄存 器 的 内 容 压 栈 和 弹出 。 指 令 
679 PUSHAD 
可 以 将 所 有 8 个 通用 寄存 器 EAX 到 EDI 中 的 内 容 压 和 人 堆栈， 而 指令 
POPAD 
则 按照 相反 的 顺序 将 它们 弹出 。 当 POPAD 到 达 原 来 保存 在 ESP 中 的 栈 顶 时 ， 它 将 丢弃 那 四 个 
字 节 而 不 将 它们 装 和 人 ESP 中 ， 并 继续 将 剩余 的 值 弹出 到 各 自 的 寄存 器 中 。 这 两 条 指令 作为 实 
现 子 程序 的 一 部 分 ， 可 用 来 有 效 地 保存 和 恢复 全 部 寄存 器 的 内 容 。 
图 E-5a 中 的 列表 加 法 程序 可 以 写成 一 个 如 图 E-8a 所 示 的 子 程序 ， 参 数 通 过 寄存 器 进行 传 
递 。 调 用 程序 将 列表 中 第 一 个 数 的 存储 器 地 址 NUMI1 装 人 寄存 器 EBX 中 ， 保 存在 存储 单元 N 
中 的 列表 项 个 数 被 装 和 人 寄存 器 ECX 中 。 调 用 程序 希望 获得 通过 寄存 器 EAX 返回 的 最 终 的 和 。 
因此 ， 寄 存 器 EBX、ECX 和 EAX 就 用 来 传递 参数 。 寄 存 器 EDI 在 子 程序 执行 加 法 运算 时 作 
为 变 址 寄存 器 ， 所 以 它 的 内 容 必须 在 子 程序 中 通过 PUSH 和 POP 指令 进行 保存 和 恢复 。 
子 程序 可 通过 下 面 的 指令 来 调用 : 
CALL LISTADD 
该 指令 首先 将 返回 地 址 压 人 堆栈 ， 然 后 跳 转 到 LISTADD 处 。 返 回 地 址 是 紧 跟 在 CALL 指令 之 
后 的 MOV 指令 的 地 址 。 子 程序 将 寄存 器 EDI 的 内 容 保存 在 堆栈 中 。 图 E-8b 给 出 了 此 时 堆栈 
中 的 内 容 。 在 执行 完 循环 之 后 ， 寄 存 器 EDI 中 原来 被 保存 的 内 容 即 可 被 恢复 。 指 令 RET 通过 
将 栈 项 元 素 弹出 到 指令 指针 ( 寄存 器 EIP ) 中 来 将 执行 控制 返回 给 调用 程序 。 
图 E-9a 给 出 的 是 对 图 E-5a 中 的 程序 使 用 堆栈 来 传递 参数 而 重新 编写 的 一 个 子 程序 。 参 
数 NUMI1 入 由 调用 程序 中 的 两 条 PUSH 指令 压 人 堆栈 。 注 意 ， 需 要 使 用 关键 字 OFFSET 来 
将 NUMI 所 表示 的 地 址 压 人 人 堆栈。 在 执行 完 CALL 指令 之 后 ， 栈 顶 处 于 第 二 级 ， 如 图 E-9b 所 
示 。 寄 存 器 EDI、EAX、EBX 和 ECX 在 这 个 子 程序 中 的 作用 与 在 图 E-8 中 的 相同 。 在 它们 
的 值 被 保存 之 后 ， 子 程序 中 的 前 八条 指令 将 初始 值 和 参数 装 人 其 中 。 这 时 ， 栈 顶 处 于 第 三 级 。 
当 这 些 数值 由 四 条 指令 的 循环 相 加 之 后 ， 相 加 的 和 被 放 到 堆栈 中 ， 覆 盖 参 数 NUM1。 在 执行 
RET 指令 之 后 ， 调 用 程序 中 的 ADD 指令 和 POP 指令 将 参数 n 从 堆栈 中 移 除 并 将 所 返回 的 相 
加 和 弹出 到 存储 单元 SUM 中 。 此 时 栈 项 被 恢复 到 第 一 级 。 
我 们 还 要 考虑 子 程序 内 套 的 情况 ,图 E-10 给 出 了 图 2-21 中 程序 的 IA-32 码 。 在 图 E-11 
给 出 了 第 一 个 和 第 二 个 子 程序 相对 应 的 堆栈 结构 。 寄 存 器 EBP 被 用 作 结构 指针 。 在 图 E-10 
i PUSHAD 和 POPAD 指令 来 将 所 有 八 个 通用 寄存 器 的 内 容 进 行 压 栈 和 弹出 ， 而 
是 选择 使 用 单个 的 PUSH 和 POP 指令 ， 因 为 这 个 子 程序 只 使 用 了 一 半数 量 的 寄存 器 。 
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EBX,NUMI1 将 参数 装 人 EBX 和 ECX 中 
ECX, N 

LISTADD 转移 到 子 程序 

SUM, EAX 将 和 保存 到 存储 器 中 


子 程序 

LISTADD: EDI 保存 EDI 
EDI, 0 将 EDI 用 作 变 址 寄存 器 
EAX, 0 将 EAX 用 作 累 加 器 


EAX, [EBX + EDI* 4] 加 上 下 一 个 数 
EDI 递增 变 址 
ECX 递减 计数 器 
STARTADD 如 果 [ECX] > 0， 则 转移 返回 
EDI 恢复 EDI 
返回 到 调用 程序 


a ) 调用 程序 和 子 程序 





ESP 一 = 
返回 地 址 
原来 的 TOS 





b ) 子 程序 中 保存 EDI 之 后 的 堆栈 内 容 
图 E-8 将 图 E-5a 中 的 程序 写成 一 个 子 程序 ; 参数 通过 寄存 器 传递 


( 假设 栈 顶 位 于 第 一 级 之 下 ) 
调用 程序 
PUSH OFFSET NUMI1 将 参数 讨 人 堆栈 
PUSH N 
CALL LISTADD 转移 到 子 程序 
ADD ESP,4 将 n 从 栈 中 移 除 
POP SUM 将 相 加 和 弹出 到 SUM 中 


子 程 序 


LISTADD: < PUSH EDI 保存 寄存 器 
PUSH EAX 
PUSH EBX 
PUSH ECX 
MOV EDI,0 将 EDI 用 作 变 址 寄存 右 
MOV EAX,0 使 用 EAX 来 累加 和 
MOV EBX, [ESP+24] 载 人 地 址 NUMI1 
MOV ECX, [ESP+20] 载 人 计数 值 n 
STARTADD: ADD “EAX, [EBX+EDI*4] 加 上 下 一 个 数 
INC EDI 递增 变 址 
DEC ECX 递减 计数 器 
JG STARTADD 如 果 没 完成 ， 则 转移 返回 
MOV [ESP+24],EAX 用 相 加 和 将 堆栈 中 的 NUMI1 覆盖 
POP ECX 恢复 寄存 器 
POP EBX 
POP EAX 
POP EDI 
RET 





a ) 调用 程序 和 子 程序 
图 E-9 将 图 E-5a 中 的 程序 写成 一 个 子 程序 ; 参数 通过 堆栈 传递 
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b ) 不 同时 刻 的 堆栈 内 容 
图 E-9 ( 续 ) 


调用 程序 


2000 将 参数 放 人 堆栈 
2006 
2012 
2017 


第 一 个 子 程序 
2100 SUB1: 保存 结构 指针 寄存 器 
载 人 结构 指针 

EAX 保存 寄存 器 
EBX 
ECX 
EDX 
EAX, [EBP+8] ”获取 第 一 个 参数 
EBX, [EBP+ 12] ”获取 第 二 个 参数 


PARAM3 将 参数 放 人 堆栈 
将 SUB2 的 结果 弹出 放 入 ECX 


将 答案 放 入 堆栈 
恢复 寄存 器 


恢复 结构 指针 寄存 器 
返回 到 主 程 序 

第 二 个 子 程 序 

3000 ”SUB2: 保存 结构 指针 寄存 器 
载 人 结构 指针 
保存 寄存 器 


EAX, [EBP + 8] 获取 参数 


[EBP + 8], EBX 将 SUB2 的 结果 放 入 堆栈 
恢复 寄存 器 


恢复 结构 指针 寄存 器 
返回 到 第 一 个 子 程序 





图 E-10 和 嵌 套 子 程序 ; 图 2-21 中 程序 的 实现 
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| 
EBP 一 = SUB2 的 堆栈 结构 


主 程 序 

ee 

[EBX] 来 自主 程序 

EAX 所 主 程序 
外 SUB1 的 堆栈 结构 

EBP 一 = [EBP] 来 自主 程序 


图 E-11 图 E-10 的 堆栈 结构 





E.4.10 ”大 数 操作 

E.4.5 节 描 述 了 多 种 算术 指令 ， 包 括 那 些 可 以 对 长 度 超 过 单个 通用 寄存 器 的 32 位 宽度 的 数 
据 进行 运算 的 指令 。ADC 和 SBB 指令 将 状态 寄存 器 中 的 CF 标志 位 作为 进位 位 。 这 些 指令 对 
于 多 精度 算术 运算 是 非常 有 用 的 。 

使 用 ADC 指令 将 超出 32 位 寄存 器 范围 的 比较 大 的 数 相 加 ， 如 图 E-12 所 示 。 要 相 加 的 
两 个 十 六 进 制 数 是 10A72C10F8 和 4A5C00FE04。 寄 存 器 EAX 和 EBX 分 别 保 存 10A72C10F8 
的 低位 和 高 位 部 分 。 同 样 ， 寄 存 器 ECX 和 EDX 分 别 保存 4A5C00FE04 的 低位 和 高 位 部 分 。 
ADD 指令 用 来 将 低 32 位 相 加 ， 产 生 了 进位 输出 1， 使 得 CF 标志 被 置 为 1。 然后， 在 将 高 位 
部 分 相 加 时 ，ADC 指令 将 这 个 标志 作为 进位 输入 位 。 相 加 和 的 低位 和 高 位 部 分 分 别 保存 在 寄 
存 器 EAX 和 EBX 中 。 

EAX, 0A72C10F8H ”EAX 中 保存 着 A72C10F8 


EBX, 10H EBX 中 保存 着 10 
ECX, 5COOFE04H ECX 中 保存 着 SCOOFE04 


EDX, 4AH EDX 中 保存 着 4A 
EAX, ECX 将 低 32 位 相 加 ; 根据 进位 输出 设置 CF 标志 
EBX, EDX CF 标志 作为 进位 输入 位 ， 将 高 32 位 相 加 





图 E-12 使 用 ADC 指令 将 大 于 32 位 的 数 相 加 


E.5 汇编 指示 
如 2.5.1 节 所 述 ， 需 要 使 用 汇编 指示 (Assembler Directive ) 来 定义 程序 的 数据 区 ， 以 及 数 
据 单元 的 符号 名 与 实际 的 物理 地 址 值 之 间 的 对 应 关系 。 
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图 E-5b 中 程序 的 完整 汇编 语言 程序 如 图 E-13 所 示 ， 它 对 应 于 图 2-13 中 的 程序 。 
图 E-13 中 的 汇编 指示 符 与 广泛 使 用 的 微软 MASM 汇编 程序 所 定义 的 汇编 指示 符 一 致 。.CODE 
和 .DATA 指示 符 定义 了 程序 代码 段 以 及 数据 段 的 开头 。 在 数据 段 中 ，DD 指示 符 为 双 字 大 小 的 
数据 分 配 存储 空间 。 标 签 SUM 是 保存 计算 得 到 的 总 和 这 个 双 字 的 单元 地 址 ， 它 被 初始 化 为 0。 
标签 N 保存 数字 150 的 单元 地 址 。 最 后 为 数字 表 列 分 配 存储 空间 。DUP 关键 字 用 来 将 存储 器 
中 指定 数量 的 连续 单元 初始 化 为 指定 的 值 。 这 样 ，150 个 连续 单元 被 初始 化 为 0。 此 外 ,还 有 
其 他 的 汇编 指示 符 ， 例 如 ，DB 可 为 字 节 大 小 的 数据 分 配 存储 空间 ，EQU 可 以 给 一 个 标签 分 配 
一 个 常量 值 。 


EBX, NUMI 


EBX, 4 
ECX,N 
EAX,0 
STARTADD: EAX, [EBX + ECX * 4] 
STARTADD 
SUM, EAX 


0 为 相 加 和 预 留 一 个 双 字 大 小 的 空间 
150 列表 中 有 N=150 个 双 字 
150 DUP(0) 为 150 个 双 字 预 留存 储 空间 





图 E-13 ”对 应 于 图 2-13 的 程序 


E.6 示例 程序 
本 节 将 介绍 2.12 节 中 所 描述 示例 程序 的 IA-32 代码 。 


E.6.1 向 量 点 积 程序 


图 E-14 所 示 的 是 对 保存 在 存储 器 中 、 起 始 地 址 是 AVEC 和 BVEC 的 两 个 数值 向 量 计 算 

其 点 积 的 程序 ， 它 对 应 于 图 2-28 中 的 程序 。 用 带 变 址 的 基 址 寻 址 方式 来 访问 每 个 向 量 中 的 连 
续 元 素 。 寄 存 器 EDI 被 用 作 变 址 寄存 器 。 由 于 假设 向 量 元 素 是 双 字 长 (4 字 节 ) 的 数 ， 所 以 
使 用 了 比例 因子 4。 寄存 器 ECX 被 用 作 循 环 计数 器 ， 初 始 值 为 nm。 这 里 允许 使 用 LOOP 指令 ， 
首先 将 ECX 减 1， 然 后 如 果 ECX 的 内 容 还 没有 到 达 0， 就 条 件 转 移 到 目的 地 址 LOOPSTART 
处 。 假 设 两 个 向 量 元 素 的 乘积 可 以 放 在 一 个 双 字 中 ， 所 以 乘法 指令 IMUL 明确 指定 了 所 需 的 目 
的 寄存 器 EDX， 正 如 E.4.5 节 中 所 描述 的 那样 。 

EBP, AVEC EBP 指向 向 量 A 

EBX, BVEC EBX 指向 向 量 B 

ECX,N ECX 是 循环 计数 器 

EAX, 0 EAX 累加 点 积 


EDI, 0 EDI 是 变 址 寄存 器 
LOOPSTART: EDX, [EBP+ EDI* 4] ”计算 下 一 对 元 素 的 点 积 


EDX, [EBX + EDI * 4] 
EDI 递增 变 址 

EAX, EDX 累加 到 先前 的 和 中 
LOOPSTART 如 果 没 有 完成 ， 则 转移 返回 
DOTPROD. EAX 将 点 积 保存 到 存储 器 中 





图 E-14 计算 两 个 向 量 点 积 的 程序 
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E.6.2 ”字符 串 搜 索 程 序 

图 E-15 给 出 了 图 2-31 中 程序 的 IA-32 版 本 。 它 在 一 个 给 定 的 目标 字符 串 工 中 确定 第 一 
与 模式 字符 串 P 相 匹 配 的 实例 。 由 于 只 有 8 个 通用 寄存 器 ， 所 以 EAX 中 的 双 字 值 被 保存 到 存 
储 单元 TMP 中 ， 这 样 ， 可 以 在 循环 中 使 用 字 节 大 小 的 寄存 器 AL。 当 再 次 需要 所 保存 的 双 字 
值 时 ， 可 以 将 该 值 恢复 到 EAX 中 。 


EAX, OFFSET T EAX 指向 字符 串 了 

EBX, OFFSETP EBX 指向 字符 串 P 

ECX,N 获取 值 n 

EDX, M 获取 值 m 

ECX, EDX 计算 n-m 

ECX, EAX ECX 是 T(nz - m) 的 地 址 

EDX, EBX EBX 是 P(z 的 地 址 

ESI, EAX ee 

EDI, EBX 用 EDI 遍历 字符 申 

DWORD PTR TMP EAX 将 EAX 保存 到 存储 器 中 允许 使 用 AL 
从 字符 串 了 中 获取 字符 
将 其 与 字符 串 P 中 的 字符 进行 比较 


字符 串 了 的 指针 增加 1 
字符 串 P 的 指针 增加 1 
检查 是 否 在 P(m) 中 
如 果 没 有 完成 ， 再 次 循环 

EAX, DWORD PTR TMP 临时 使 用 后 恢复 EAX 

DWORD PTR RESULT, EAX 保存 TU 的 地 址 

DONE 

NOMATCH: 》 EAX, DWORD PTR TMP 临时 使 用 后 恢复 EAX 

指向 了 中 的 下 一 个 字符 
检查 是 否 在 Tn - mm) 中 
如 果 没 有 完成 ， 再 次 循环 
没有 找到 匹配 





图 E-15 字符 串 搜索 程序 


E.7 中断 与 异常 


实现 IA-32 体系 结构 的 处 理 器 使 用 两 根 中 断 请 求 线 ， 一 根 是 不 可 屏蔽 中 断 请 求 线 NMI， 
另 一 根 是 可 屏蔽 中 断 请 求 线 ， 也 被 称 为 用 户 中 断 请 求 线 INTR。NMI 上 的 中 断 请 求 总 是 会 被 处 
理 器 接收 ， 而 INTR 上 的 请 求 仅 当 它们 的 优先 级 比 当 前 正在 运行 程序 的 优先 级 高 的 情况 下 才 会 
被 接收 。 可 通过 设置 状态 寄存 器 中 的 中 断 允 许 位 正 来 允许 或 禁止 NTR 中 断 。 

除了 外 部 中 断 ， 还 会 发 生 其 他 可 使 得 程序 在 执行 过 程 中 产生 异常 的 事件 ， 这 些 事件 包括 
无 效 的 操作 码 、 除 零 操 作 和 溢出 ， 还 包括 跟踪 和 断 点 中 断 。 

这 些 事件 中 任 一 事件 的 发 生 都 会 使 处 理 器 转移 到 一 个 中 断 服务 程序 。 我 们 为 每 个 中 断 或 
异常 分 配 一 个 向 量 号 。 在 INTR 情况 下 ， 当 中 断 请 求 得 到 确认 后 ，LO 设备 通过 总 线 发 送 其 向 
量 号 。 对 于 其 他 的 异常 ， 向 量 号 是 预先 分 配 好 的 。 根 据 向 量 号 ， 处 理 器 就 可 以 通过 一 个 中 断 撒 
述 符 表 ( Interrupt Descriptor Table ) 来 确定 中 断 服 务 程序 的 起 始 地 址 了 。 

IA-32 处 理 器 依赖 于 一 个 配套 的 高 级 可 编程 中 断 控 制 器 ( Advanced Programmable Interrupt 
Controller，APIC )， 各 种 VO 设备 都 是 通过 这 个 控制 器 来 与 处 理 器 连接 的 。 中 断 控 制 器 实现 了 
不 同 设备 间 的 优先 级 结构 ， 并 为 每 一 个 设备 发 送 一 个 适当 的 向 量 号 给 处 理 器 。 

图 E-1 所 示 的 状态 寄存 器 中 包含 了 中 断 允 许 标 志 (IF )、 陷 阱 标志 (TF ) 以 及 IO 权限 
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级 别 (IOPL )。 当 IF=1 时 ， 可 以 接收 INTR 中 断 。 陷 阱 标志 允许 每 条 指令 执行 后 都 产生 跟踪 
中 断 。 

中 断 在 操作 系统 的 上 下 文中 尤其 重要 。IA-32 体系 结构 定义 了 一 个 复杂 的 特权 结构 ， 从 而 
可 以 使 操作 系统 的 不 同 部 分 在 四 个 不 同 的 特权 级 别 上 执行 。 每 一 个 特权 级 别 使 用 处 理 器 地 址 空 
间 中 的 不 同 的 段 。 从 一 个 级 别 切 换 到 另 一 个 级 别 包 含 了 大 量 的 检查 操作 ， 这 些 操作 由 一 种 称 为 
门 ( gate ) 的 机 制 来 实现 。 这 样 就 可 以 构建 一 个 高 度 安全 的 操作 系统 。 处 理 器 也 可 以 运行 在 一 
种 简单 的 模式 下 ， 在 这 种 模式 中 没有 实现 特权 ， 所 有 的 程序 都 运行 在 相同 的 段 中 。 在 此 我 们 只 
讨论 这 种 简单 模式 。 

当 收 到 一 个 中 断 请 求 或 者 发 生 一 个 异常 时 ， 处 理 器 执行 以 下 操作 : 

1 ) 它 将 状态 寄存 器 、 代 码 段 寄 存 器 (CS ) 和 指令 指针 ( EIP ) 压 人 处 理 器 堆栈 中 。 

2 ) 对 于 不 正常 的 执行 条 件 所 引发 的 异常 ， 处 理 器 会 将 一 个 代码 压 人 堆栈 来 描述 产生 异常 
的 原因 。 

3 ) 处 理 器 清除 相应 的 中 断 允 许 标志 ， 这 样 可 以 禁止 同一 中 断 源 再 次 发 送 的 中 断 。 

4) 处 理 器 根据 中 断 的 向 量 号 从 中 断 描 述 符 表 中 读 取 中 断 服务 程序 的 起 始 地 址 ， 并 将 其 装 
入 EIP 中 去 ， 然 后 继续 执行 。 

响应 中 断 请 求 后 ， 中 断 服务 程序 使 用 中 断 返 回 指令 IRET 返回 到 被 中 断 的 程序 。IRET 指 
令 将 EIP、CS 和 状态 寄存 器 的 内 容 从 堆栈 弹出 到 相应 的 寄存 器 中 ， 从 而 恢复 处 理 器 的 状态 。 

对 于 子 程序 ， 中 断 服 务 程序 可 能 会 通过 保存 寄存 器 或 者 使 用 堆栈 结构 保存 局 部 变量 来 创 
建 一 个 临时 的 工作 空间 。 在 执行 IRET 指令 之 前 ， 它 必须 恢复 先前 保存 的 寄存 器 并 确保 堆栈 指 
针 ESP 指向 返回 地 址 。 


E.8 输入 /输出 示例 


本 节 利 用 第 三 章 描述 的 IO 示例 和 接口 寄存 器 来 展示 IA-32 指令 是 如 何 用 于 轮 询 以 及 基于 
中 断 的 IO 操作 的 。 

图 E-16 给 出 了 图 3-5 中 程序 的 IA-32 版 本 ， 这 里 使 用 轮 询 的 方式 实现 输入 和 输出 操作 。 
BT 指令 对 应 于 图 3-5 中 的 TestBit 指令 ， 它 将 指定 位 的 值 复 制 到 状态 寄存 器 的 CF 标志 中 。 该 
程序 将 每 个 字符 从 键盘 接口 读 人 到 寄存 器 AL 中 ， 以 便于 之 后 与 回 车 符 CR 作 比 较 。 随 着 每 个 
字符 从 寄存 器 AL 保存 到 存储 器 中 ， 寄 存 器 EBX 通过 递增 来 增加 指针 。 


EBX, LOC 初始 化 寄存 器 EBX， 使 其 指向 主 存 中 存储 字符 的 
第 一 个 单元 的 地 址 


KBD_STATUS, 1 等 待 一 个 字符 被 输入 到 键盘 缓冲 区 KBD_DATA 中 
READ 
AL,KBD_DATA 将 字符 传送 到 AL 中 ( 这 将 KIN 清 为 0 ) 


人 AL 将 字符 存储 到 主 存 中 ， 并 递增 指针 

DISP_STATUS, 2 等 待 显 示 器 准备 就 绪 

ECHO 

DISP_DATA, AL 把 刚 读 人 的 字符 移 到 显示 器 缓冲 寄存 器 中 
(这 将 DOUT 清 为 0) 

AL, CR 如 果 不 是 CR， 则 转移 回去 读 取 另 一 个 字符 

READ 





图 E-16 读 取 并 显示 一 行 字 符 的 程序 
为 了 说 明 中 断 是 如 何 用 于 IO 操作 的 ， 图 E-17 实现 了 图 3-10 中 的 例子 。 初 始 化 代码 中 的 
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BTS 指令 用 来 对 键盘 接口 中 的 中 断 允 许 位 进行 设置 , STI 指令 将 状态 寄存 器 中 的 正 标志 置 为 1， 
使 得 处 理 器 可 以 响应 中 断 请 求 。 中 断 服务 程序 中 的 BTR 指令 用 于 清除 键盘 接口 中 的 中 断 允许 
位 。 指 针 被 保存 在 一 个 存储 单元 中 ， 中 断 服 务 程 序 每 处 理 一 个 字符 指针 便 增加 1。 我 们 假设 键 
盘 发 送 一 个 向 量 号 为 了 的 中 断 请 求 ， 并 且 将 中 断 服务 程序 的 起 始 地 址 READ 装 入 中 断 描述 符 表 
中 相应 的 表 项 i 中。 


中 断 服务 程序 


READ: PUSH EAX 将 寄存 器 EAX 保存 到 堆栈 中 
EBX 将 寄存 器 EBX 保存 到 堆栈 中 
EBX, PNTR 载 人 地 址 指针 
AL, KBD_DATA 将 字符 传送 到 AL 中 
[EBX], AL 将 字符 写 人 存储 器 并 递增 指针 
DWORD PTR PNTR 
DISP_STATUS, 2 等 待 显示 器 准备 就 绪 
ECHO 
DISP_DATA, AL 显示 刚 读 入 的 字符 
AL, CR 检查 刚 读 和 人 的 字符 是 否 为 回 车 符 (CR ) 
RTRN 如 果 不 是 CR 则 返回 


DWORD PTR EOL, 1 指示 行 的 结束 
KBD_CONT, 1 禁止 键盘 中 断 
EBX 恢复 寄存 器 
EAX 


从 中 断 返 回 


DWORD PTR PNTR, OFFSET LINE ”初始 化 缓冲 区 指针 
DWORD PTR EOL,0 清除 行 结束 指示 变量 
KBD_CONT ,1 允许 键盘 中 断 
设置 处 理 器 寄存 器 中 的 中 断 标 志 
下 一 条 指令 


图 E-17 使 用 中 断 方式 读 取 一 行 字符 并 使 用 轮 询 方式 显示 该 行 字符 的 程序 





E.9 标量 浮 点 运算 


IA-32 体系 结构 定义 了 许多 浮 点 运算 指令 ， 它 们 由 一 个 单独 的 浮 点 运算 单元 (foating- 
point uint，FPU ) 执行 ， 该 浮 点 运算 单元 中 包含 了 额外 的 寄存 器 。FPU 人 允许 浮 点 运算 与 其 他 指 
令 并 发 执行 。 本 节 将 概括 介绍 IA-32 体系 结构 的 浮 点 功能 以 及 一 些 浮 点 运算 指令 。 第 1 章 中 已 
经 介绍 了 浮 点 数 的 表示 方法 ， 浮 点 数 的 算术 运算 也 在 第 9 章 中 进行 了 讨论 。 

所 有 的 浮 点 运算 都 是 对 80 位 的 扩展 双 精 度数 进行 的 。 图 E-1 所 示 的 8 个 80 位 浮 点 数据 寄 
存 器 就 是 为 此 目的 而 提供 的 。 对 这 些 寄存 器 中 保存 的 扩展 双 精 度数 进行 运算 可 减 小 计算 过 程 中 
累加 的 舍 人 误差 ， 如 9.7 节 所 介绍 的 那样 。FPU 中 还 有 额外 的 控制 和 状态 寄存 器 ， 其 细节 可 在 
Intel 的 技术 文档 [1] 中 查阅 。 

FPU 的 一 个 独特 功能 是 可 将 8 个 浮 点 数据 寄存 器 看 作 堆 栈 。 一 些 使 用 这 些 寄存 器 进行 算 
术 运 算 或 数据 传输 操作 的 指令 也 可 以 执行 压 栈 或 弹出 操作 。 指 向 寄存 器 堆栈 栈 顶 的 指针 可 由 
FPU 维护 ， 不 需要 对 该 指针 进行 特殊 的 初始 化 操作 。 压 栈 和 弹出 操作 将 指针 调整 为 对 8 取 模 的 
形式 ， 使 其 在 必要 的 时 候 可 以 循环 回去 。 

在 汇编 语言 中 ， 浮 点 寄存 器 操作 数 可 由 助 记 符 STQ) 确定 ， 这 里 i 是 与 寄存 器 堆栈 栈 顶 相 
关 的 变 址 (0 i 7)。 例如 ，ST(0) 表示 寄存 器 堆栈 当前 栈 项 的 那个 寄存 器 ，ST(1) 表示 堆 
栈 中 的 下 一 个 寄存 器 ， 以 此 类 推 ，ST(7) 指 的 是 最 后 一 个 寄存 器 。 在 用 汇编 语言 编写 程序 时 ， 
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程序 员 需 要 跟踪 浮 点 指令 序列 所 执行 的 压 栈 与 弹出 操作 ， 从 而 可 以 正确 地 识别 每 条 指令 的 操 
作 数 。 

浮 点 加 载 指令 都 有 一 个 显 式 的 操作 数 用 来 指明 存储 器 中 的 源 单元 。 这 些 指令 将 从 存储 器 
中 读 取 的 值 压 入 寄存 器 堆栈 中 。 poi i hn entra ht ds 
器 。 执 行 完 加 载 指令 后 ， 目 的 寄存 器 变 成 ST(O)， 作 为 寄存 器 堆栈 新 的 栈 顶 。 这 是 因为 指向 寄 
存 器 堆栈 栈 顶 的 指针 被 调整 为 对 8 取 模 的 形式 。 和 的 洗 符 SO) 变 眠 37 ，STOD 变 
ST(2)， 依 此 类 推 . 

对 于 浮 点 存储 指令 ， 源 操作 数 隐 含 地 保存 在 寄存 句 ST(0) 中 。 男 一 个 明确 的 操作 数 指 明 
了 存储 器 中 的 目的 单元 ， 可 将 寄存 器 ST(0) 中 的 值 写 人 到 该 单元 中 去 。 一 些 存储 指令 使 寄存 器 
堆栈 保持 不 变 ， 其 他 的 会 弹出 ST(0)。 指 向 寄存 器 堆栈 栈 项 的 指针 被 调整 为 对 8 取 模 的 形式 ， 
但 跟 加 载 指令 不 同 的 是 ， 它 们 的 方向 是 相反 的 。 完 成 弹出 操作 后 ， 先 前 的 寄存 器 ST(0) 变 成 
ST(7)，ST(1) 变 成 ST(0)， 依 此 类 推 。 

浮 点 算术 指令 的 源 操作 数 或 目的 操作 数 必须 在 寄存 器 ST(0) 中 。 对 于 某 些 指令 ， 寄 存 器 
ST(0) 被 隐 含 地 指定 为 目的 单元 ， 只 有 源 操作 数 需 要 明确 地 指定 ， 且 必须 在 存储 占 中 。 其 他 指 
令 则 显 式 地 指明 两 个 操作 数 ， 一 个 必须 在 寄存 器 ST(0) 中 ， 它 既 可 以 是 源 操作 数 也 可 以 是 目的 
操作 数 ， 而 另外 一 个 可 以 在 任何 一 个 寄存 器 ST(D 中 。 一 些 指令 不 需要 显 式 的 操作 数 ， 因 为 对 
于 源 单元 和 目的 单元 它们 都 隐 含 地 使 用 了 寄存 右 ST(0)。 

浮 点 寄存 器 总 是 保存 80 位 的 扩展 双 精 度数 ， 而 存储 器 可 以 保存 32 位 单 精度 或 64 位 双 精 
度 表示 的 数 。 当 涉及 大 量 的 浮 点 数 但 不 需要 太 高 的 精度 时 ， 单 精度 表示 就 降低 了 对 存储 空间 的 
需求 。 在 进行 算术 运算 之 前 ，FPU 会 自动 地 将 存储 器 中 的 单 精度 或 双 精 度 操作 数 转换 成 扩展 的 
双 精 度数 。 当 需要 将 它们 传送 到 存储 器 中 时 ， Rn 
示 形 式 。 在 与 存储 器 传输 数据 的 时 候 ，FPU 还 会 将 整数 和 扩展 的 双 精 度 浮 点 表示 互相 转换 。 不 
用 软件 而 用 硬件 来 实现 这 样 的 转换 可 减少 执行 时 间 和 代码 大 小 。 


E.9.1 Load 指令 和 Store 指令 
FLD 指令 从 一 个 存储 单元 中 读 取 一 个 浮 点 数 并 将 其 压 和 人 到 浮 点 寄存 器 堆栈 中 。 关 键 字 
DWORD PTR 用 来 指示 单 精 度 操 作 数 ， 而 关键 字 QWORD PTR 则 用 来 指示 双 精 度 操 作 数 。 在 
这 两 种 情况 下 ， 从 存储 器 中 读 取 的 值 都 会 被 转换 成 80 位 的 扩展 双 精 度 格式 。 例 如 ， 指 令 
FLD DWORD PTR [EAXI] 
从 存储 单元 [EAX] 处 读 取 一 个 单 精度 浮 点 数 ， 将 其 转换 成 80 位 的 格式 ， 并 压 人 到 寄存 器 堆 
栈 中 。 
FST 指令 把 ST(0) 中 的 浮 点 数 写 入 到 存储 器 中 ,在 这 种 情况 下 ， 指 向 寄存 器 堆栈 栈 项 的 指 
针 不 受 影 响 。 需 要 使 用 适当 的 关键 字 DWORD PTR 或 QWORD PTR 来 指明 要 写 入 存储 器 的 
值 的 大 小 ， 这 决定 了 ST(0) 中 的 80 位 表示 形式 是 转换 成 单 精 度 格式 还 是 双 精 度 格式 。 例 如 ， 
指令 
FST QWORD PTR [EDX+8] 
将 ST(0) 中 的 80 位 浮 点 数 转换 成 64 位 的 双 精 度 格 式 ， 并 将 转换 后 的 值 写 入 到 存储 单元 
[EDX]+8 中 。 
IA-32 体系 结构 还 提供 了 加 载 和 存储 32 位 整数 操作 数 的 指令 。 这 些 指令 可 将 整数 自动 转 
换 成 80 位 的 浮 点 格式 或 将 80 位 的 浮 点 格式 转换 成 整数 。FILD 指令 从 存储 器 中 读 取 一 个 32 
位 的 整数 ， 将 其 转换 成 一 个 80 位 的 浮 点 数 之 后 再 压 人 到 寄存 器 堆栈 中 。FIST 指令 将 寄存 器 
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ST(0) 中 的 80 位 浮 点 数 转换 成 一 个 32 位 的 整数 ， 然 后 再 将 其 写 和 人 到 存储 器 中 。 这 不 会 改变 指 
向 寄存 器 堆栈 栈 项 的 指针 。 

最 后 ，IA-32 体系 结构 中 还 提供 了 存储 并 弹出 指令 ， 这 些 指 令 在 将 寄存 帮 ST(0) 中 的 内 
容 (经 过 适当 的 转换 ) 写 人 到 存储 器 中 后 会 将 其 从 栈 中 弹出 。 这 意味 着 先前 的 寄存 器 ST(0) 变 
成 ST(7)，ST(1) 变 成 ST(0)， 依 此 类 推 。FSTP 指令 执行 的 操作 与 FST 指令 一 样 ， 但 是 它 还 将 
ST(0) 从 栈 中 弹出 。 同 样 ，FISTP 指令 也 结合 了 FIST 指令 的 操作 和 弹出 操作 。 


E.9.2 算术 指令 
对 浮 点 数 执行 算术 运算 的 基本 指令 有 FADD、FSUB、FMUL 以 及 FDIV。 对 于 需要 显 式 指 
明 一 个 操作 数 的 指令 ， 这 个 操作 数 必须 是 源 操 作 数 ， 并 且 必 须 在 存储 器 中 。 目 的 操作 数 被 隐 含 
地 保存 在 寄存 器 ST(0) 中 。 来 自 存 储 器 的 操作 数 在 执行 算术 运算 之 前 被 转换 成 80 位 的 扩展 双 
精度 格式 。 例 如 ， 指 令 
FADD QWORD PTR [EAXI] 
从 存储 单元 [EAX] 中 读 取 64 位 的 双 精 度数 ， 将 其 转换 成 80 位 的 扩展 双 精 度 表 示 形 式 ， 然 后 
将 转换 后 的 值 与 寄存 器 ST(0) 中 的 当前 值 相 加 ， 并 将 相 加 和 放 到 ST(0) 中 。 
对 于 需要 显 式 指明 两 个 操作 数 的 指令 ， 这 两 个 操作 数 都 必须 在 寄存 器 中 ， 其 中 一 个 寄存 
器 还 必须 是 ST(0)。 例 如 ， 指 邻 
FMUL ST(0), ST(3) 
将 ST(0) 和 ST(3) 中 的 值 相 乘 ， 并 将 乘积 放 到 ST(0) 中 。 
指令 FADDP、FSUBP、FMULP 以 及 FDIVP 在 执行 完 算术 运算 后 会 将 寄存 器 堆栈 的 栈 顶 
元 素 弹 出 。 这 些 指令 都 必须 指明 保存 在 寄存 器 中 的 两 个 操作 数 。 使 用 ST(1) 作为 目的 单元 是 比 
较 适当 的 。 弹 出 操作 完成 后 ， 结 果 就 在 寄存 器 堆栈 新 的 栈 顶 寄存 器 中 。 例 如 ， 指 令 
FSUBP ST(1), ST(0) 
从 ST(1) 中 减 去 ST(0) 的 值 ， 并 将 结果 放 到 ST(1) 中 ， 然 后 弹出 ST(0)。 因 此 ， 现 在 结果 位 于 堆 
栈 的 栈 项 ST(0) 中 。 
指令 FIADD、FISUB、FIMUL 以 及 FIDIV 显 式 指明 了 存储 器 中 的 一 个 32 位 操作 数 。 目 
的 操作 数 则 隐 含 地 保存 在 寄存 器 ST(0) 中 。 在 执行 算术 运算 之 前 ， 这 个 32 位 的 整数 被 自动 转 
换 成 80 位 的 扩展 双 精 度 表 示 形 式 。 例 如 ， 指 令 
FIDIV DWORD PTR [ECX+ 4] 
从 存储 单元 [ECX]+4 中 读 取 一 个 32 位 的 整数 ， 将 其 转换 成 80 位 的 浮 点 表示 形式 ， 然 后 再 将 
转换 后 的 值 除 以 ST(0) 中 的 值 ， 并 把 运算 结果 放 入 ST(0) 中 。 
对 于 减法 和 除法 运算 ， 操 作 数 的 顺序 是 非常 重要 的 。 因 为 浮 点 寄存 器 被 组 织 成 一 个 堆栈 ， 
它 有 时 可 能 需要 将 这 些 算术 运算 的 操作 数 的 顺序 颠倒 过 来 ， 以 便于 随后 可 从 堆栈 中 弹出 一 个 特 
殊 的 结果 或 操作 数 。 指 令 FSUBR 和 FDIVR 就 是 可 实现 此 目的 的 指令 。 例 如 ， 指 令 
FSUBR ST(3), ST(0) 
执行 操作 ST(3) 二 [ST(0)] - [ST(3)]。 而 指 今 
FSUB ST(3), ST(0) 
则 执行 操作 ST(3) 一 [ST(3)] - [ST(0)]。 


E.9.3 比较 指令 
浮 点 比较 指令 可 以 用 来 设置 状态 寄存 器 中 的 条 件 码 标志 。 这 样 表 E-2 中 的 条 件 跳 转 指令 就 
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可 以 用 来 检测 不 同 的 条 件 了 。FUCOMI 和 FUCOMIP 指令 可 对 寄存 器 中 的 两 个 浮 点 操作 数 进行 
比较 。 目 的 操作 数 必须 在 ST(0) 中 。 执行 完 比较 操作 后 ，FUCOMIP 指令 同样 也 会 弹出 ST(0)。 
例如 ， 指 令 

FUCOMI ST(0), ST(4) 
执行 减法 [ST(0)] - [ST(4)]， 并 根据 结果 来 设置 状态 寄存 器 中 的 ZF 和 CF 标志 ， 然 后 将 结果 丢 
弃 。 这 样 ， 随 后 的 Jump 指令 就 可 以 检测 适当 的 条 件 了 : ST(0) = ST(4) 时 为 正 ，ST(0) >ST(4) 
时 为 JA，ST(0) < ST(4) 时 为 JB。 


E.9.4 其 他 指令 


IA-32 还 提供 了 一 些 其 他 的 指令 ， 如 求 平方 根 (FSQRT )、 更 改 符号 (FCHS )、 求 绝对 值 
(FABS )、 求 正弦 (FSIN ) 和 余弦 (FCOS ) 的 指令 。 这 些 指令 都 不 需要 显 式 的 操作 数 ， 因 为 对 
于 源 操 作 数 和 目的 操作 数 ， 它 们 都 隐 含 地 使 用 了 ST(0)。 换 句 话 说， 寄存 器 堆栈 栈 项 寄存 器 中 
的 值 被 运算 结果 替代 ， 且 指向 栈 顶 的 指针 没有 改变 。 

IA-32 还 提供 了 一 些 指令 ， 可 用 来 将 常用 的 浮 点 常量 压 栈 。FLDZ 指令 可 将 0.0 压 入 寄存 
器 堆栈 中 ，FLD1 指令 可 将 1.0 压 入 寄存 器 堆栈 中 。FLDPI 指令 可 将 的 扩展 双 精 度 浮 点 表示 
( 精确 到 小 数 点 后 19 位 ) 压 人 寄存 器 堆栈 中 。 这 些 指令 都 不 需要 显 式 地 指明 操作 数 。 


E.9.5 浮 点 程序 示例 


图 E-18 给 出 了 一 个 示例 程序 。 假 设 有 两 个 点 (xo, yo) 和 (xu 加 )， 该 程序 确定 经 过 这 两 个 点 
的 直线 的 斜率 m 和 截 距 bp， 当 这 两 个 点 位 于 一 条 垂直 线 上 时 除外 。 


EAX, OFFSET COORDS EAX 指向 坐标 列表 
QWORD PTR [EAX + 24] 将 yp 压 入 寄存 器 堆栈 
QWORD PTR [EAX + 16] 将 x 压 人 寄存 器 堆栈 
QWORD PTR [EAX + 8] 将 yo 压 入 寄存 器 堆 栈 
QWORD PTR [EAX] 将 xo 压 入 寄存 器 堆栈 
ST(2), ST(0) 计算 x -xzo; 弹出 mo 

将 0.0 压 栈 
ST(0), ST(2) 确定 分 母 是 否 为 0 
NO_SLOPE 如 果 分 母 为 0， 则 斜率 m 是 不 确定 的 
ST(2), ST(O0) 计算 一 mo; 弹出 yo 
ST(1), ST(0) 计算 m= 0 yo) / (x1-xo) 
EBX, OFFSET SLOPE EBX 指向 存储 单元 SLOPE 


QWORD PTR [EBX] 将 斜率 保存 到 存储 器 中 

QWORD PTR [EAX + 8] 将 yo 压 人 寄存 器 堆栈 

QWORD PTR [EAX] 将 x 压 人 寄存 器 堆栈 

ST(2), ST(0) 计算 mxo; 弹出 xo 

ST(1), ST(0) 计算 b=yo-m:xo; 弹出 yo 
EBX, OFFSET INTERCEPT EBX 指向 存储 单元 INTERCEPT 


QWORD PTR [EBX] 将 截 距 保存 到 存储 器 中 ; 弹出 栈 项 元 素 


EBX,0 表明 直线 不 是 垂直 的 
DONE 
NO_SLOPE: EBX, 1 表明 直线 是 垂直 的 
DONE: DWORD PTR VERT_LINE, EBX 





图 E-18 计算 直线 斜率 与 截 距 的 浮 点 程序 


假定 两 点 的 坐标 部 、 蔬 、 反 和 六 为 64 位 的 双 精 度 浮 点 数 ， 存 储 在 从 COORDS 单元 开始 
的 连续 存储 单元 中 。 该 程序 把 计算 得 到 的 斜率 和 截 距 作为 双 精 度数 放 在 存储 单元 SLOPE 和 
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INTERCEPT 中 。 直 线 的 斜率 由 式 子 m = (y1 一 yo) / (x1 -xo) 确定 ， 因 此 ， 该 程序 在 执行 除法 运 
算 之 前 必须 先 检查 分 母 是 否 为 零 。 当 分 母 为 零 时 ， 两 点 在 一 条 垂直 线 上 。 该 程序 就 将 值 1 写 到 
存储 单元 VERT_LINE 中 以 反映 这 种 情况 ， 并 指出 存储 单元 SLOPE 和 INTERCEPT 中 的 值 是 
无 效 的 ， 不 做 进一步 的 计算 。 否 则 ， 该 程序 计算 出 斜率 值 ， 并 将 其 保存 到 存储 器 中 。 对 于 有 效 
的 斜率 ， 程 序 计算 出 截 距 5 = yo - m* xo， 然后 将 其 写 到 存储 器 中 。 在 此 例 中 ,减法 运算 使 用 了 
FSUBR 指令 ， 该 指令 将 操作 数 的 顺序 颠倒 过 来 。 最 后 ， 程 序 将 零 写 到 存储 单元 VERT_LINE 
中 来 表明 斜率 和 截 距 是 有 效 的 。 


E.10 多 媒体 扩展 ( MMX ) 操作 


一 个 二 维 图 形 或 视频 图 像 可 以 用 一 个 包含 采样 图 像 点 的 大 矩阵 来 表示 ， 这 些 采 样 图 像 点 
被 称 为 像素 ( pixel )。 每 个 点 的 颜色 和 亮度 可 以 被 编码 成 一 个 8 位 的 数据 项 。 这 样 的 数据 处 理 
有 两 个 主要 特点 。 第 一 个 特点 是 单个 像素 的 操作 通常 只 包括 非常 简单 的 算术 或 逻辑 运算 。 另 一 
个 特点 是 一 些 实时 的 显示 应 用 需要 很 高 的 计算 性 能 。 而 对 于 采样 的 音频 信号 或 语音 处 理 (在 
一 定 的 时 间 间 隔 内 对 连续 的 模拟 信号 进行 采样 并 用 一 系列 有 符号 数 来 表示 ) 来 说 ， 也 具有 这 
些 特 点 。 

在 这 样 的 应 用 中 ， 如 果 单 个 数据 项 是 字 节 或 16 位 的 字 ， 并 能 打包 成 其 元 素 可 以 并 行 处 理 
的 小 组 ， 那 么 就 可 以 获得 很 高 的 处 理 效率 。 这 种 能 并 行 处 理 的 向 量 或 单 指令 多 数据 ( SIMD ) 
指令 在 第 12 章 中 进行 了 描述 。IA-32 指令 集中 包含 了 很 多 SIMD 指令 ， 这 些 指令 被 称 为 多 媒体 
扩展 ( MultiMedia eXtension，MMX ) 指令 。 它 们 能 同时 对 多 个 数据 元 素 ( 被 打包 成 64 位 的 四 
字 ) 执行 相同 的 操作 。MMX 指令 的 操作 数 可 以 在 存储 器 或 八 个 浮 点 寄存 器 中 ， 这 样 ， 这 些 寄 
存 器 具有 双重 作用 。 它 们 可 以 保存 浮 点 数 或 MMX 操作 数 。 当 被 MMX 指令 使 用 时 ， 这 些 寄 存 
器 作为 MM0 到 MM7 来 引用 ， 并 且 每 个 80 位 寄存 器 中 只 有 最 低 的 64 位 是 与 MMX 操作 相关 
的 。 与 E.9 节 中 的 浮 点 指令 不 同 的 是 ，MMX 指令 不 将 这 个 共享 的 寄存 器 组 作为 堆栈 来 管理 。 

IA-32 体系 结构 提供 了 MOVQ 指令 ， 用 于 在 存储 器 和 MMX 寄存 器 之 间 传 送 64 位 的 四 字 
操作 数 。 例 如 ， 指 令 

MOVQ MM0, [EAX] 
将 寄存 器 EAX 所 指向 的 存储 单元 中 的 四 字 装 人 寄存 器 MM0 中 。MOVQ 指令 还 可 以 用 来 在 
MMX 寄存 器 之 间 传 送 数据 。 例 如 ， 指 令 

MOVQ MM3, MM4 
将 寄存 器 MM4 中 的 内 容 传送 到 寄存 器 MM3 中 。 

IA-32 体系 结构 中 还 提供 了 一 些 指令 ， 可 以 对 打包 的 四 字 操 作 数 (packed quadword 
operand ) 中 的 多 个 元 素 并 行 执行 算术 和 逻辑 运算 。 源 操作 数 可 以 在 存储 器 或 一 个 MMX 寄存 
釉 中 ， 但 是 目的 地 必须 是 一 个 MMX 寄存 器 。 大 多 数 的 MMX 指令 使 用 一 个 后 缀 来 指示 打包 的 
四 字 操 作 数 中 数据 元 素 的 大 小 ( 和 个 数 ) : B 表示 字 节 (8 个 元 素 )，W 表示 字 ( 4 个 元 素 )，D 
表示 双 字 ( 2 的 元 素 )，Q 表示 四 字 ( 1 个 元 素 )。 例 如， 指令 

PADDB MM?2, [EBX] 
将 寄存 器 MM2 中 和 寄存 器 EBX 所 指向 的 存储 单元 中 的 八 个 相应 字 节 相 加 。 八 个 相 加 和 并 行 
计算 ， 结 果 放 在 寄存 器 MM2 中 。 

IA-32 体系 结构 中 还 提供 了 减法 指令 (PSUB )、 乘 法 指令 (PMUL )、 将 乘法 和 加 法 合并 的 
指令 (PMADD )、 逻 辑 运 算 指 令 (PAND、POR 和 PXOR )， 以 及 可 以 对 打包 的 四 字 操 作 数 进 
行 很 多 其 他 操作 的 指令 - 
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E.11 向量 ( SIMD ) 浮 点 运算 
E.9 节 描 述 了 对 单个 浮 点 数 进行 运算 的 指令 。IA-32 体系 结构 中 还 提供 了 回 量 (SIMD ) 
指令 来 同时 对 多 个 浮 点 数 进行 运算 。 在 Intel 术语 中 ， 这 些 指令 被 称 为 流 式 SIMD 扩展 
( Streaming SIMD Extension，SSE ) 指令 。 它 们 处 理 的 是 打包 的 128 位 双 四 字 操 作 数 ， 每 一 个 
操作 数 由 四 个 32 位 的 浮 点 数组 成 。 可 使 用 八 个 额外 的 128 位 寄存 器 XMM0 到 XMM7 来 保存 
这 些 操作 数 。 
MOVAPS 和 MOVUPS 指令 可 在 存储 器 和 XMM 寄存 器 之 间或 者 在 XMM 寄存 器 之 间 传 送 
打包 的 双 四 字 。PS 后 组 表示 双 四 字 中 的 打包 单 精度 浮 点 值 。A 或 U 标号 用 来 确定 存储 器 地 址 
是 否 必须 与 16 位 字 的 边界 对 齐 或 者 可 以 不 对 齐 。 指 令 
MOVUPS XMM3,[EAX] 

将 128 位 的 双 四 字 从 寄存 器 EAX 所 指向 的 存储 单元 装 人 寄存 器 XMM3 中 。 指 令 
MOVUPS XMM4,XMMS5 

将 寄存 器 XMM5 中 的 双 四 字 传 输 到 寄存 器 XMM4 中 。 

还 可 对 两 个 双 四 字 操 作 数 中 的 四 对 32 位 浮 点 数 同时 执行 基本 的 算术 运算 。 源 操作 数 可 
以 在 存储 器 或 一 个 XMM 寄存 器 中 ， 但 是 目的 地 必须 是 一 个 XMM 寄存 器 。 这 样 的 指令 有 
ADDPS、SUBPS、MULPS 和 DIVPS。 例如， 指令 

ADDPS XMMO,XMMI 
将 寄存 器 XMM0 和 XMMI1 中 四 对 相应 的 浮 点 数 相 加 ， 并 将 四 个 相 加 和 放 到 寄存 器 XMM0 中 。 


E.12 ”问题 解析 
本 节 将 介绍 一 些 可 能 要 求学 生 解 决 的 典型 问题 ， 并 分 析 说 明 如 何 解 决 这 样 的 问题 。 
问题 : 假设 有 一 个 ASCII 编码 的 字符 串 保存 在 存储 器 中 ， 起 始 地 址 为 STRING。 该 字符 串 以 回 车 符 
(CR ) 结束 。 写 一 个 IA-32 程序 来 确定 该 字符 串 的 长 度 。 
解答 : 图 E-19 给 出 了 一 个 可 能 的 程序 。 字 符 串 中 的 每 个 字符 与 CR( ASCII 码 为 0D ) 进行 比较 , 计 
数 器 递增 ， 直 至 到 达 字 符 串 的 末尾 。 结 果 存 储 在 单元 LENGTH 中 。 
EAX, OFFSET STRING EAX 指向 字符 串 的 开始 
EDI, 0 ED1 是 计数 器 ， 被 清 为 0 


BL, BYTE PTR [EAX + EDI] 将 下 一 个 字符 装 人 EBX 的 最 低 字 节 中 
BL, ODH 将 字符 与 CR 进行 比较 


DONE 如 果 匹 配 ， 则 结束 
EDI 递增 计数 器 
LOOP 如 果 没 有 结束 ， 则 循环 回 到 前 面 

DWORD PTR LENGTH, EDI 将 计数 值 存放 到 存储 单元 LENGTH 中 





图 E-19 例 E.5 的 程序 


| 全 | E.6| 
问题 : 我 们 希望 在 一 个 32 位 的 非 负 整数 列表 中 找 出 最 小 的 数 。 数 据 的 存储 地 址 从 1000 开始 。 该 地 
址 处 的 双 字 必须 保存 所 找到 的 最 小 数 。 下 一 个 双 字 包含 列表 中 的 项 数 n。 之 后 的 nn 个 双 字 包含 列表 中 的 
数 。 写 一 个 程序 ， 找 出 最 小 的 数 ， 并 包含 按照 规定 组 织 数据 所 需 的 汇编 指示 ( assembler directive )。 
解答 : 图 E-20 中 的 程序 实现 了 所 需 的 任务 。 该 程序 假设 n 宇 1， 且 列表 中 包含 了 一 些 样本 数字 。 
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1000 列表 起 始 地 址 


EAX, OFFSET LIST ”EAX 指向 列表 的 开始 

EDI, [EAX + 4] EDI 是 计数 器 ， 初 始 化 为 n 

EBX, EAX 调整 EBX 的 值 后 ，EBX 指向 第 一 个 数 
EBX, 8 

ECX, [EBX] ECX 保存 目前 为 止 所 找到 的 最 小 的 数 
EDI 递减 计数 器 

DONE 如 果 EDI 为 0， 则 结束 

EDX., [EBX] 获取 下 一 个 数 

EBX, 4 递增 指针 

ECX, EDX 将 下 一 个 数 与 目前 的 最 小 数 进行 比较 
LOOP 如 果 下 一 个 数 不 小 于 目前 的 最 小 数 ， 则 再 次 循环 
ECX, EDX 和 否则， 更 新 目前 的 最 小 数 

LOOP 再 次 循环 

[EAX], ECX 将 最 小 的 数 保存 到 SMALL 中 


1000 
0 所 找到 的 最 小 数 的 存储 空间 
7 列表 中 的 项 数 

4, 5, 3, 6, 1, 8, 2 列表 中 的 项 





图 E-20 例 E.6 的 程序 


问题 : 写 一 个 程序 ， 将 一 个 n 位 十 进 制 整数 转换 成 二 进 制 数 。 如 果 数 字 是 通过 键盘 输入 的 ， 那 么 十 
进 制 数 是 以 个 ASCII 编码 字符 的 形式 给 出 的 。 

解答 : 考虑 一 个 4 位 的 十 进 制 数 D， 由 数字 ddsdido 表示 - 该 数 的 值 为 (( 必 x 10+4d) x 10+d) x 
10 + do。 该 数 的 这 种 表示 是 图 E-21 中 程序 所 使 用 转换 技术 的 基础 。 注 意 ， 每 个 ASCII 编码 字符 先 通过 
AND 指令 转换 成 一 个 二 进 制 编码 的 十 进 制 ( BCD ) 数字 ， 然 后 再 用 于 计算 。 


ECX, DWORD PTR N ECX 是 计数 器 ， 初 始 化 为 n 
ESI, OFFSET DECIMAL ESI 指向 ASCII 数字 
EBX 用 来 保存 二 进 制 数 
EDI 用 来 乘 以 10 
获取 下 一 个 ASCII 数字 
产生 BCD 数字 


加 到 中 间 结 果 中 
递减 计数 器 


如 果 结 束 ， 则 退出 循环 

乘 以 10 

递增 指针 

如 果 未 完成 ， 则 循环 回 到 前 面 
DONE: MOV DWORD PTR BINARY, EBX 将 结果 存放 到 存储 单元 BINARY 中 





图 E-21 例 E.7 的 程序 


问题 : 考虑 一 个 数字 阵列 A(i, 站)， 其 中 i= 0 到 n-1， 是 行 索引 , j = 0 到 m-1， 是 列 索引 。 该 阵列 按 
行 存储 在 计算 机 的 存储 器 中 ， 每 行 元 素 占用 m 个 连续 的 字 单 元 。 写 一 个 子 程序 ， 将 第 x 列 的 元 素 逐 一 加 
到 第 y 列 的 元 素 上 ， 和 和 元素 ( sum element ) 放 在 第 列 上 。 索 引 值 x 和 ?通过 寄存 器 EAX 和 EBX 传递 
给 子 程序 。 参 数 n 和 m 通过 寄存 器 ECX 和 EDX 传递 给 子 程序 元素 A(0,0) 的 地 址 通过 寄存 器 EDI 进行 
解答 : 图 E-22 给 出 了 一 个 可 能 的 程序 。 我 们 假定 值 *、y、n 和 m 分 别 存放 在 存储 单元 X、Y、N 和 
M 中 。 此 外 ， 阵 列 中 的 元 素 存储 在 从 单元 ARRAY 开始 的 连续 的 字 中 ，ARRAY 是 元 素 A(0,0) 的 地 址 。 
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程序 中 的 注释 说 明了 每 条 指令 的 作用 。 


MOV EAX,DWORD PTR X 载 人 值 x 
MOV EBX,DWORDPTRY 载 入 值 ? 





























MOV ECX,DWORD PTR N 载 人 值 n 

MOV EDX,DWORDPTRM 载 入 值 m 

MOV EDI,OFFSETARRAY 载 入 A(0,0) 的 地 址 
CALL SUB 

下 一 条 指令 

SUB: PUSH ESI 保存 寄存 器 ESI 的 内 容 

SHL EDX,2 确定 一 列 中 连续 元 素 之 间 的 距 
离 ( 以 字 节 为 单位 ) 

SUB EBX,EAX 产生 yx 的 值 

SHL EBX,2 产生 40' 一 x) 的 值 

SHL EAX,2 产生 4x 的 值 

ADD EDI,EAX EDI 指向 A(0x ) 

MOV “ESI, EDI 

ADD ”ESL EBX ESI 指向 A(0y ) 

LOOP: MOV “EAX, [EDI] 获取 第 x 列 中 的 下 一 个 数 
MOV EBX, [ESJ] 获取 第 了 列 中 的 下 一 个 数 
ADD EAX,EBX 将 两 数 相 加 ， 并 保存 和 
MOV [ESI], EAX 
ADD EDI,EDX 递增 第 x 列 的 指针 
ADD ESI,EDX 递增 第 y 列 的 指针 
DEC ECX 递减 行 计数 器 
JG LOOP 如 果 未 完成 ， 则 循环 回去 
POP ESI 恢复 寄存 器 ESI 的 内 容 


返回 到 调用 程序 


图 E-22 例 E.8 的 程序 


问题 : 假设 存储 单元 BINARY 中 包含 一 个 32 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显 
示 设 备 上 将 这 些 位 显示 为 8 个 十 六 进 制 数字 。 写 一 个 程序 完成 这 个 任务 。 

解答 : 首先 ， 我 们 需要 将 这 个 32 位 的 模式 转化 为 用 ASCII 编码 字符 表示 的 十 六 进 制 数 字 。 转 换 过 
程 可 以 使 用 查 表 法 来 完成 。 必 须 构造 一 个 包含 16 项 的 表 ， 以 便于 为 每 一 个 十 六 进 制 数字 提供 其 ASCII 
码 。 然 后 ， 对 于 BINARY 中 该 模式 的 每 一 个 4 位 的 段 ， 都 可 以 在 表 中 查找 到 其 相应 的 字符 ， 并 将 这 些 字 
符 存 储 在 从 地 址 HEX 开始 的 连续 字 节 单元 中 。 最 后 ， 将 从 地 址 HEX 开始 的 这 8 个 字符 发 送 给 显示 器 。 
图 E-23 给 出 了 一 个 可 能 的 程序 。 


EAX, DWORD PTR BINARY 载 人 该 二 进 制 数 

ECX,8 ECX 是 计数 器 ， 被 置 为 8 

EDI, OFFSET HEX EDI 指向 十 六 进 制 数字 

ESI, OFFSET TABLE ESI 指向 ASCII 码 转换 表 

EAX, 4 将 高 位 数字 循环 移 位 到 低位 位 置 上 
EBX, EAX 将 当前 值 复制 到 另 一 个 寄存 器 中 


EBX, OFH 提取 下 一 个 数字 

DL, [ESI + EBX] 获取 该 数字 的 ASCII 码 

[EDI), DL 将 其 存储 在 HEX 缓冲 区 中 

EDI 递增 数字 指针 

ECX 递减 数字 计数 器 

LOOP 如 果 不 是 最 后 一 个 数字 ， 则 循环 回 到 前 面 





图 E-23 例 E.9 的 程序 
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DISPLAY: MOV ECX,8 
MOV EDI,OFFSET HEX 
MOV ESI,OFFSET DISP_DATA 
DLOOP: MOV EDX,[ESI+4] 通过 测试 DOUT 标志 来 检查 显示 器 是 否 准备 就 绪 
AND EDX,4 
也 DLOOP 
MOV DL, [EDI 获取 下 一 个 ASCII 字符 
INC EDI 递增 字符 指针 
MOV [ESI DL 将 其 发 送 给 显示 器 
DEC ECX 


递减 计数 器 
JG DLOOP 循环 ， 直 到 所 有 的 字符 都 显示 完毕 
下 一 条 指令 


.DATA 
ORG 1000 

DB 8 DUP (0) ASCII 编码 数字 的 存储 空间 
DB 30H,31H,32H,33H ASCII 码 转 换 表 

DB 34H,35H,36H,37H 

DB 38H,39H,41H,42H 

DB 43H,44H,45H,46H 





图 E-23 ( 续 ) 


E.13 结束语 


IA-32 指令 集 是 应 用 非常 广泛 的 CISC 设计 的 一 个 例子 。 对 不 同类 型 的 数据 ， 如 单个 整数 
和 浮 点 数 ， 以 及 打包 的 整数 和 浮 点 数 向 量 ，IA-32 指令 集 都 可 以 对 其 进行 广泛 的 操作 。 尽 管 如 
此 大 的 指令 集 有 一 定 的 挑战 性 ， 但 IA-32 指令 集 还 是 在 一 些 高 性 能 处 理 器 中 实现 了 。 


习题 
[E] E.1 写 一 个 程序 ， 计 算 表 达 式 SUM = 580 + 68 400 + 80 000。 
[E] E.2 写 一 个 程序 ， 计 算 表达 式 ANSWER =A x B+C xD。 
[M] E.3 写 一 个 程序 ， 在 一 个 含有 个 32 位 整数 的 列表 中 找 出 所 包含 的 负 整 数 的 个 数 ， 并 将 该 计数 保存 
在 单元 NEGNUM 中 。 保存 在 存储 单元 N 中 ， 列 表 中 的 第 一 个 整数 保存 在 单元 NUMBERS 中 。 
在 程序 中 包含 必要 的 汇编 指示 ( assembler directive ) 和 一 个 样本 列表 ， 列 表 中 含有 6 个 数字 ， 其 
中 一 些 是 负数 。 
[E] E.4 为 图 E-6 中 的 程序 写 一 个 如 图 E-13 所 示 风 格 的 汇编 语言 程序 。 假 设 采用 图 2-10 所 示 的 数据 
布局 。 
[M] E.5 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.10 中 的 问题 。 
[E] E.6 写 一 个 IA-32 程序 来 解决 第 2 章 中 例 2.5 所 描述 的 问题 。 
[M] E.7 写 一 个 IA-32 程序 来 解决 第 3 章 中 例 3.5 所 描述 的 问题 。 
[E] E.8 写 一 个 IA-32 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 
[E] E.9 假设 TABLE 的 地 址 是 0x10100， 写 一 个 IA-32 程序 来 解决 第 3 章 中 例 3.6 所 描述 的 问题 。 
[E] E.10 写 一 个 程序 ， 在 视频 显示 器 的 一 行 上 以 十 六 进 制 形式 显示 主 存 中 10 个 字 节 的 内 容 。 该 字 节 串 
在 存储 器 中 的 起 始 位 置 是 LOC。 每 个 字 节 将 显示 为 两 个 十 六 进 制 字 符 。 连 续 字 节 应 以 空格 
分 隔 。 
[M] E.11 假设 存储 单元 BINARY 中 包含 一 个 16 位 的 模式 。 我 们 希望 在 一 个 具有 图 3-3 所 示 接 口 的 显示 
设备 上 将 这 些 位 显示 为 0 和 1 组 成 的 字符 串 。 写 一 个 程序 完成 这 个 任务 。 
[M] E.12 使 用 图 3-17 中 的 七 段 显示 器 和 图 3-14 中 的 定时 器 电路 ， 写 一 个 程序 ， 显 示 序 列 0、1、2、 
9、0、… 中 的 十 进 制 数 字 ， 每 个 数字 显示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 100 MHz 的 
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时 钟 驱动 的 。 

[D1 全国 317 所 的 和 214 所 的、 写 一 个 程序 ， 显 示 序 列 0、1、 

、98、99、0、… 中 的 数 ， 每 个 数 显示 一 秒 钟 。 假 设 定时 器 电路 中 的 计数 器 是 由 100 MHz 

es 

[D] E.14 写 一 个 程序 ， 计 算 实时 时 钟 时 间 并 以 小 时 (0 ~ 23 ) 和 分 钟 (0 一 59 ) 的 形式 显示 时 间 。 显 示 
器 包括 4 个 图 3-17 所 示 的 七 段 显示 设备 。 还 有 一 个 具有 图 3-14 所 示 接 口 的 定时 器 电路 ， 其 计 
数 器 是 由 100 MHz 的 时 钟 驱 动 的 。 

[M] E.15 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.22 中 的 问题 。 假 设 将 要 被 压 人 /弹出 的 元 素 位 于 寄存 
器 EAX 中 ， 并 假设 寄存 器 EBX 用 作用 户 栈 的 栈 指针 。 

[M] E.16 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.24 中 的 问题 。 

[M] E.17 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.25 中 的 问题 。 

[M] E.18 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.26 中 的 问题 。 

[M] E.19 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.27 中 的 问题 。 

[M] E.20 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.28 中 的 问题 。 

[M] E.21 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.29 中 的 问题 。 

[M] E.22 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.30 中 的 问题 。 

[M] E.23 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.31 中 的 问题 。 

[D] E.24 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.32 中 的 问题 。 

[D] E.25 写 一 个 IA-32 程序 来 解决 第 2 章 的 习题 2.33 中 的 问题 。 

[M] E.26 写 一 个 IA-32 程序 来 解决 第 3 章 的 习题 3.20 中 的 问题 。 

[M] E.27 写 一 个 IA-32 程序 来 解决 第 3 章 的 习题 3.22 中 的 问题 。 

[D] E.28 写 一 个 IA-32 程序 来 解决 第 3 章 的 习题 3.24 中 的 问题 。 

[D] E.29 写 一 个 IA-32 程序 来 解决 第 3 章 的 习题 3.26 中 的 问题 。 

[Dj] E.30 当 0 志 x m2 时， 函数 sin(x) 能 以 合理 的 精度 近似 为 x-x 16+/120=x (1 一 x(1/6 一 (1/120)))。 
写 一 个 子 程序 SIN， 接 受 一 个 输入 参数 ( 该 参数 是 指向 存储 器 中 一 个 浮 点 值 x 的 指针 )， 并 使 用 
上 述 只 涉及 x 和 妆 的 第 二 个 表达 式 来 计算 sin(x) 的 近似 值 。 计 算 所 得 的 值 应 返回 到 存放 输入 参 
数 x 的 存储 单元 中 。 子 程序 使 用 的 任何 整数 寄存 器 都 应 根据 需要 进行 保存 和 恢复 。 通 过 比较 该 
子 程序 的 运行 结果 和 IA-32 指令 集中 FSIN 指令 的 执行 结果 ， 对 该 子 程序 中 所 采用 的 近似 精度 进 
行 研 究 。 
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A 


AD ( 模 / 数 )， 参 见 Analog-to-Digital conversion 
Access time (访问 时 间 ) 
magnetic disk ( 磁盘 )，315 
main memory ( 主 存储 器 )，5，269 
effect of cache ( 高 速 缓存 的 影响 )，301 
Actuators ( 执行 器 )，410 
Adder (加 法 器 ) 
BCD，378 
carry-lookahead ( 超前 进位 )，340 
circuit (电路 )，337 
full adder (全 加 器 )，336 
half adder ( 半 加 器 )，377 
least-significant bit ( 最 低 有 效 位 )，336 
most-significant bit ( 最 高 有 效 位 )，339 
propagation delay ( 传播 延迟 )，339 
ripple-carry ( 行 波 进位 )，336 
Addition( 加 法 )，11，13，336 
carry ( 进位 ) 11，336 
carry-save ( 进位 保留 )，353 
end-around carry ( 循环 进位 )，382 
floating-point ( 浮 点 )，367 
generate function ( 生成 函数 )，340 
modular ( 模 )，12 
overflow【〈 溢 出 )，14，15，337 
propagate function ( 传播 函数 )，340 
sum (和 )，11，336 
Address (地址 )，5，29 
aligned/unaligned ( 对 齐 的 /不 对 齐 的 )，31 
big-endian ( 大 端 )，30 
little-endian (小 端 )，30 
Address pointer ( 地 址 指针 )，42 
Address space ( 地 址 空间 )，29，268 
Address translation ( 地 址 转换 )，306 


Addressing mode ( 寻 址 方式 )，35，40，75 
absolute ( 绝对 )，41 
autodecrement ( 自动 减 量 )，76 
autoincrement ( 自动 增 量 )，75 
immediate ( 立即 )，42 
index ( 变 址 )，45，157 
indirect ( 间接 )，42 
register ( 寄存 器 )，41 
relative ( 相对 )，76 
Nios I ,532 
ColdFire, 575 
ARM, 614 
IA-32，665 
Alarm clock ( 闹钟 )，428 
Alphanumeric characters( 字母 数字 字符 )，17 
ASCII, 18 
Amdahls law (Amdahl 定律 )，461 
Analog to digital ( A/D ) conversion ( 模 / 数 转换 )， 
248，388 
Arbiter ( 仲裁 者 )，237 
Arbitration ( 仲裁 )，237 
Architecture ( 体系 结构 )，2 
Arithmetic and logic unit( ALU， 算 术 逻 辑 部 件 ),5， 
153, 160 
ARM processor ( ARM 处 理 器 )，611 


.ASCII (American Standards Committee on 


Information Exchange ) code ( 美国 信息 交换 标 
准 码 ，ASCII 码 )，17 
Assembler (汇编 程序 )，49，130 
Assembly language ( 汇编 语言 )，49 
directives ( commands ) ( 指示 符 (命令 ))，50 
generic ( 通用 )，28 
mnemonics ( 助 记 符 )，34，49 
notation ( 标记 )，33 
syntax (语法 )，49 
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Nios II, 532, 549 

ColdFire, $73, 593 

ARM, 614, 635 

IA-32，670，685 
Associative search ( 相 联 检索 )，294 
Asynchronous DRAM ( 异步 DRAM )，276 
Asynchronous bus ( 异步 总 线 )， 参 见 Bus 
Asynchronous transmission ( 异步 传输 )，245 


B 


Bandwidth ( 带宽 ): 
interconnection network ( 互连网 络 )，450 
memory ( 存储 器 )，279 
Barrier synchronization ( 屏障 同步 )，458 
Base register ( 基 址 寄存 器 )，48 
BCD， 参 见 Binary-coded decimal 
Big-endian ( 大 端 )，30 
Binary-coded decimal ( BCD， 二 进 制 编码 的 十 进 
制 )，17，54 
addition ( 加 法 )，378 
Binary variable ( 二 进 制 变量 )，466 
Bit (位 )，4，28 
Booth algorithm ( Booth 算法 )，348 
bit-pair recoding ( 位 偶 重 编码 )，352 
skipping over ls ( 跳 过 1 位 )，350 
Boot-strapping ( 引导 )，144 
Bounce (反弹 )， 参 见 Contact bounce 
Branch ( 转移 ) 
delay slot (延迟 槽 )，204 
delayed( 延迟 转移 )，205 
instruction( 转移 指令 )，38，77，168 
offset ( 偏 移 量 )，54 
penalty ( 转移 代价 )，202 
prediction ( 转移 预测 )，205 
target ( 转移 目标 )，38 
target buffer ( 转移 目标 缓冲 区 )，208 
Branching ( 转移 )，37，77 
Breakpoint ( 断 点 )，136 
Bridge ( 桥 )，252 
Broadcast ( 广播 )，453 
Bus (总 线 )，179，450 
arbitration ( 仲裁 )，237 
asynchronous ( 异步 )，233 


driver ( 驱动 需 )，179，236 
master ( 主 控 )，230，237 
propagation delay ( 传播 延迟 )，231 
protocol ( 协议 )，229 
skew ( 相位 偏 移 )，234 
slave ( 从 动 设备 )，230 
synchronous ( 同步 )，230 
timing ( 时 序 )，231 
Bus standards ( 总 线 标准 ) 
ISA, 258 
FireWire ( 火线 )，251 
PATA, 258 
PL, .252 
PCI Express, 258 
SCSI, 256 
SAS, 258 
SAIA，258 
USB, 247 
Bus structure ( 总 线 结构 )，228 
Byte ( 字 节 )，17，29 
Byte addressable memory ( 按 字 节 寻 址 存储 器 )，30 


C 


Cache memory ( 高 速 缓冲 存储 器 )，5，269，289 
associative mapping ( 相 联 映射 )，293 ，299 
block ( 块 )，290 
coherence (一 致 性 )，296，453 

directory-based ( 基于 目录 )，456 
snooping ( 监听 )，454 
direct mapping ( 直接 映射 )，298 
dirty bit ( 脏 位 )，290 
hit ( 命中 )，290 
hit rate ( 命中 率 )，301 
levels ( 层次 )，289 
line ( 行 )，290 
load through ( 直接 装 人 )，291 
lockup-free ( 无 锁定 )，305 
mapping function ( 映射 功能 )，290，291 
miss ( 失效 )，291 
miss penalty ( 失效 开销 )，301 
miss rate ( 失效 率 )，301 
prefetching ( 预 取 )，304 
replacement algorithm ( 替换 算法 )，290，296 
set-associative mapping ( 组 相 联 映射 )，294，299 


stale data ( 过 时 数据 )，294 
tag (标志 )，293 
valid bit ( 有 效 位 )，294 
write-back ( 写 回 )，290，294，454 
write buffer ( 写 缓冲 区 )，303 
write-through ( 直接 写 )，290，453 
Carry (进位 )，11，336 
detection ( 检测 )，551 
Cartridge tape ( 盒 式 磁带 )，323 
CD-ROM ( 只 读 光盘 )，318 
Character codes ( 字符 码 )，17 
ASCII, 18 
Charge-coupled device ( CCD， 电 荷 砚 合 器 件 )，387 
Chip (芯片 )，17 
CISC ( Complex Instruction Set Computer， 复 杂 指 
令 集 计算 机 )，34，74，178，572，661 
Circular buffer (queue ) ( 环形 缓冲 区 (队列 ))，92 
Clock (时 钟 )，230，493 
rate ( 速率 )，209 
period ( 周期 )，154 
duty cycle ( 占 空 比 )，260 
self-clocking ( 自 同步 时 钟 )，313 
Clock recovery (时钟 复位 )，246，313 
Cloud computing ( 云 计算 )，3 
Coherence ( 一致 性 )， 参 见 Cache memory 
ColdFire processor ( ColdFire 处 理 器 )，571 
Combinational circuits ( 组 合 电 路 )，154，494 
Comparator ( 比较 器 )，170，186 
Compiler ( 编译 程序 ， 编 译 器 )，133 
optimizing ( 优化 )，134 
vectorizing ( 向 量化 )，446 
Complement ( 补 码 )，468 
Complementary metal-oxide semiconductor ( CMOS, 
互补 金属 氧化 物 半导体 )，484 
Complex Instruction Set Computer ( 复杂 指令 集 计 
算 机 )， 参 见 CISC 
Complex programmable logic device (CPLD， 复 杂 
可 编程 逻辑 器 件 )，513 
Compute Unified Device Architecture ( CUDA ,统一 
计算 设备 体系 结构 )，448 
Computer types ( 计算 机 类 型 )，2 
Computer-aided design (CAD， 计 算 机 辅助 设计 )，424 
Condition codes ( 条 件 码 )，77 
flag (标志 )，77 
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in pipelined processor ( 在 流水 线 处 理 器 中 )，218 
side effect ( 副作用 )，218 
ColdFire, 572, $99 
ARM, 629 
IA-32，663 
Condition code register ( 条 件 码 寄存 器 )，77 
Conditional branch ( 条 件 转 移 )，38，77，169 
Configuration device ( 配置 器 件 )，423 
Contact bounce ( 接触 反弹 )，239 
Context switch ( 上 下 文 切 换 )，148 
Control signals ( 控制 信号 )，172 
Control store( 控制 存储 器 )，183 
Control unit ( 控制 单元 )，6 
Control word( 控制 字 )，183 
Counter ( 计数 器 ) 
ripple(〈 行 波 )，504 
Synchronous ( 同步 )，504，516 
Crossbar ( 交叉 开关 )，452 


D 


D/A ( 数 / 模 )， 参 见 Digital-to-analog conversion 
Data ( 数据 )，4 
Data dependency ( 数据 依赖 性 )，197，457 
Data striping ( 数据 条 带 化 )，317 
Data types ( 数据 类 型 ) 
bit (位 ), 4 
byte〈 字 节 )，17 
character (字符 )，17 
foating-point ( 浮 点 )，16，363 
integer ( 整 型 ， 整 数 )，10 
fraction ( 小数 )，365，372 
string ( 串 )，81 
word ( 字 )，5，29 
Datapath ( 数据 通路 )，161 
Deadlock ( 死 锁 )，217 
Debouncing ( 消除 反弹 )，239 
Debugger ( 调试 器 )，134 
Debugging ( 调试 )，54，117 
Decoder ( 译 码 器 )，505 
instruction decoder ( 指令 译 码 器 )，176 
De Morgan's rule ( 德 摩根 定律 )，475 
Desktop compnuter ( 台式 机 )，2 
Device driver ( 设备 驱动 程序 )，148 
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Device interface ( 设备 接口 )，97 
Differential signaling ( 差分 信号 )，251，256， 
238; 279 
Digital camera ( 数码 照相 机 )，387 
Digital-to-analog conversion ( 数 / 模 转 换 )，248 
Direct memory access ( 直接 存储 器 访问 )， 和 参见 DMA 
Directory-based cache coherence ( 基于 目录 的 高 速 
缓存 一 致 性 )，456 
Dirty bit( 脏 位 )， 参 见 Cache memory 
Disk ( 盘 )， 和 参见 Magnetic disk 
Disk arrays 〈 磁盘 阵列 )，317 
Dispatch unit ( 调度 部 件 )，212 
Display ( 显示 器 )，6，97 
Division ( 除法 )，360 
floating-point ( 浮 点 )，368 
non-restoring ( 不 恢复 )，361 
restoring ( 恢复 )，360 
DMA ( Direct Memory Access， 直 接 存 储 器 访问 )， 
285, 306 
controller ( 控制 器 )，286 
Don't care condition ( 无 关 项 条 件 )，477 
DVD ( 数字 多 功能 光盘 )，5，321 
Dynamic memory ( DRAM， 动态 存储 器 )，274 


E 


Echoback ( 回 显 )，101 
Edge-triggered flip-flop( 边沿 触发 触发 器 )，498 
Effective address ( 有 效 地 址 )，42 
Effective throughput ( 有 效 硬 吐 量 )，450 
Embedded computer ( 典 和 人 式 计算 机 )，2 
Embedded system ( 骨 入 式 系统 )，2，386，422， 
530,，651 
Enterprise system ( 企业 系统 )，2 
Error correcting code ( ECC., 纠 错 码 )，316 
Ethernet ( 以 太 网 )，252 
Exception ( 异常 )，116，556，639，687， 参 见 
Interrupt 
floating-point ( 浮 点 )，367 
handler ( 处 理 程序 )，558 
imprecise ( 不 精确 )，216 
precise ( 精确 的 )，216 
Execution phase ( 执行 阶段 )，37，153 
Execution steps ( 执行 步骤 )，155，185 


Execution step counter ( 执行 步 计数 器 )，175 
Execution step timing ( 执行 步 时 序 )，171，178 
External name ( 外 部 名 )，132 


F 


Fan-in ( 扇 人 )，490 
Fan-out ( 局 出 )，490 
Fetch phase ( 取 指 令 阶段 )，37，153 
Field-programmable gate array ( FPGA， 现 场 可 编 
程 门 阵列 )，21，423，514 
FIFO ( first-in，first-out ) queue ( 先进 先 出 队列 )，92 
File (文件 )，130，322 
Finite state machine ( 有 限 状 态 机 )，520 
FireWire ( 火线 )，251 
Fixed point (定点 )，16 
Flash memory (闪存 )，284 
Flash cards( 闪存 卡 )，284 
Flash drives ( 闪存 驱动 器 )，284 
Flip-flops( 触发 器 )，496 
D (D 触发 器 )，495 
edge-triggered ( 边沿 触发 )，498 
gated latch ( 门 控 锁 存 器 )，493 
下 (下 触发 器 )，499 
latch ( 锁 存 器 )，492 
master-slave ( 主 从 )，495 
SR latch ( SR 锁 存 器 )，494 
T (TT 触发 器 )，498 
Floating point ( 浮 点 )，16，363 
addition-subtraction unit ( 加 法 /减法 部 件 )，369 
arithmetic operation ( 算术 运算 )，367 
double precision ( 双 精 度 )，365 
exception ( 异常 )，367 
inexact ( 不 精确 )，367 
invalid ( 非法 )，367 
exponent ( 指数 )，16，364 
excess-x representation ( 余 x 表示 )，365 
format ( 格式 )，364 
guard bits ( 保护 位 )，368 
sticky bit ( 粘着 位 )，369 
IEEE standard ( IEEE 标准 )，16，364 
mantissa ( 尾数 )，365 
normalization ( 规格 化 )，365 
overflow ( 溢出 )，366 


representation ( 表示 )，364 

scale factor( 比例 因子 )，16，364 
base ( 基数 )，16，364 
exponent ( 指数 )，16，364 

significant digits ( 有 效 数 字 )，364 

single precision ( 单 精度 )，364 

special values ( 特殊 值 )，366 
denormal ( 非 规格 化 )，366 
gradual underflow ( 逐 级 下 滋 )，366 
infinity ( 无 穷 大 )，366 
Not a Number ( NaN， 非 数 ， 无 定义 数 )，367 

truncation ( 截取 )，368 
biased/unbiased ( 有 偏 /无 偏 )，368 
chopping ( 截断 )，368 
rounding ( 舍 人 )，368 
von Neumann ( 冯 ，。 诺 依 曼 )，368 

underflow (下 洲 )，366 

Nios II，562 

ColdFire, $599 

ARM, 650 

IA-32, 690,696 

Floppy disk ( 软盘 )，316 


G 


Gated latch ( 门 控 锁 存 器 )，493 

General-purpose register ( 通用 寄存 器 )，8 

GPU ( Graphics Processing Unit ) ( 图 形 处 理 单元 )，448 
Gray code ( Gray 码 )，524 

Grid computer ( 网 格 计 算 机 )，2 


H 


Handshake ( 握手 )，233 
full ( 完全 握手 )，235 
interlocked ( 互 锁 )，235 
Hardware ( 硬件 )，2 
Hardware interrupt ( 硬件 中 断 )，103 
Hardwired control ( 硬件 控制 )，175 
Hazard ( 冲突 )，197 
branch delay ( 转移 延迟 )，202 
data dependency ( 数据 依赖 性 )，197 
memory delay ( 存储 器 延迟 )，201 
resource limitation ( 资源 限制 )，209 
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Hexadecimal( 十 六 进 制 )， 参 见 Number representation 

High-level language ( 高 级 语言 )，17，20，133， 
137，399，432，456 

History of computers( 计算 机 历史 )，19 

Hit (命中 )， 参 见 Cache memory 

Hold time ( 保持 时 间 )，231，498 

Hot-pluggable ( 可 热 插 拔 的 )，249 


IA-32 processor ( IA-32 处 理 器 )，661 
IEEE standards ( IEEE 标准 )， 套 见 Standards 
Immediate operand 〈 立即 操作 数 )，164 
Index register ( 变 址 寄存 器 )，45 
Ink jet printer ( 喷 墨 打印 机 )，6 
Inputoutput (IO， 输 入 /输出 ) 
address space ( 地 址 空间 )，97 
device interface( 设备 接口 )，97，229，238 
in operation system ( 在 操作 系统 中 )，146 
interrupt-driven ( 中 断 驱 动 )，103，556，598， 
048，689 
memory-mapped ( 存储 器 映射 )，97，229 
port ( 端口 )，239 
privilege level ( 优先 级 )，688 
program-controlled ( 程序 控制 )，97，556，597， 
046，689 
status flag ( 状态 标志 )，98 
register ( 寄存 器 )，97 
unit ( 设备, 部件 ), 4, 6 
Nios II, $55 
ColdFire, 597 
ARM, 646 
IA-32，689 
Input unit ( 输入 设备 )，4 
Instruction ( 指令 )，4，7，32 
commitment ( 提交 )，216 
completion queue( 完成 队列 )，216 
execution phase( 执行 阶段 )，37，153 
dispatch ( 调度 )，217 
fetch phase ( 取 指 令 阶 段 ), 37，153 
queue ( 队列 )，212 
reordering ( 重新 排序 )，204 
retired ( 释放 )，217 
side effects ( 副作用 )，218 
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Instruction encoding ( 指令 编码 )，82，168 
Instruction execution ( 指令 执行 )，155，165 
Instruction fetch( 指令 提取 )，164 
Instruction format ( 指令 格式 ): 
generic ( 通用 的 )，84 
one-address ( 单 地 址 )，670 
three-address( 三 地 址 )，35 
two-address ( 两 地 址 )，74 
Nios II，5S33 
ColdFire, 573 
ARM, 615 
IA-32，670 
Instruction register ( 及， 指令 寄存 器 )，7，37，152 
Instruction set architecture ( ISA， 指 令 集 体系 结构 )，28 
Instructions ( 指令 ): 
arithmetic (算术 )，7，536，578，622，672 
branch (转移 )，38，538，582，628，674 
control ( 控制 )，111，548，596 
data transfer ( 数据 传送 ) 7，534，577，621，67] 
input/output (输入 /输出 )，535 
logic ( 逻辑 )，67，537，585，626，677 
move ( 移动 )，43，537，577，625，671 
multimedia ( 多 媒体 )，695 
shift and rotate ( 移 位 和 循环 移 位 )，68，546， 
586, 625, 678 
subroutine ( 子 程序 )，5$6，541，587，631，679 
vector ( SIMD， 向量 )，445，696 
Integrated circuit ( IC， 集 成 电路 )，21 
Intellectual property ( IP， 知 识 产权 )，422 
Interconnection network ( 互连网 络 )，3，450 
bandwidth (带宽 )，450 
bus (总 线 )，179，228，450 
split-transaction ( 分 割 事务 )，450 
computer system ( 计算 机 系统 )，252，258 
crossbar ( 交叉 开关 )，452 
effective throughput ( 有 效 吞 吐 量 )，450 
mesh ( 网 状 )，452 
packet ( 数据 包 )，450 
ring ( 环 状 )，451 
torus ( 圆 环形 )，453 
tree ( 树 状 )，249 
Interface ( 接口 ): 
input (输入 )，239 


output ( 输出 )，242 
parallel ( 并 行 )，239，392 
serial ( 串 行 )，243 ，395 
Internet ( 国际 互联 网 )，3，4 
Interrupt ( 中 断 )，9，103， 参 见 Exception 
acknowledge (确认 )，105 
disabling ( 禁止 )，106 
enabling ( 允许 )，106，109 
execution steps ( 执行 步 )，185 
handler ( 处 理 程序 )，116 
hardware ( 硬件 )，103 
in operating systems ( 在 操作 系统 中 )，146 
latency (等待 )，105 
nesting ( 能 套 )，108 
nonmaskable ( 不 可 屏蔽 )，596，687 
priority ( 优先 级 )，109 
service routine ( 服务 程序 )，9，104 
software ( 软件 )，146 
vectored (向量 )，108，139 
Nios II，556 
ColdFire, 596 
ARM, 639 
IA-32，687 
lnvalidation protocol ( 无 效 协议 )，453 
OO， 参见 Input/Output 
IP core (IP 内 核 )，530 
IR (instruction register， 指 令 寄 存 器 )，7 
Isochronous ( 等 时 )，248，249，251 


Joystick ( 操作 杆 )，4 
JTAG port (JTAG 端口 )，514 


K 


Karnaugh map ( 卡 诺 图 )，475 
Keyboard ( 键盘 )，4，97 
interface ( 接口 )，99，239 


上 


Laser printer ( 激光 打印 机 )，6 
Latch ( 锁 存 器 )，492 
Library ( 库 )，133 


LIFO ( last-in，first-out ) queue ( 后 进 先 出 队列 )，55 
Link register ( 链接 寄存 器 )，57 
Linker ( 连接 程序 )，132 
Little-endian ( 小 端 )，30 
Load through ( 直接 装 人 ) 参见 Cache memory 
Load-store multiple operands ( 加 载 - 存 储 多 操作 
数 )，62 
ColdFire, 588 
ARM, 621 
IA-32，679 
Loader ( 装载 程序 )，54，131 
Locality of reference (引用 局 部 性 )，289，296 
Logic circuits〈 逻辑 电路 )，466 
Logic function ( 逻辑 函数 )，466 
AND ( 与 )，468 
Exclusive-OR (XOR， 蜡 或 )，468 
minimization ( 最 小 化 )，472 
NAND (与 非 )，479 
NOR (或 非 )，479 
NOT ( 非 )，468 
OR (或 )，466 
synthesis (组 合 )，470，508 
Logic gates ( 逻辑 门 )，469 
fan-in ( 扇 人 )，490 
fan-out ( 扇 出 )，490 
noise margin ( 噪声 容 限 )，489 
propagation delay ( 传播 延迟 )，489 
threshold ( 阔 值 )，482 
transfer characteristic ( 传输 特性 )，488 
transition time( 转换 时 间 )，490 
Logical memory address ( 逻辑 存储 器 地 址 )，305 
LRU ( least-recently used ) replacement ( 最 近 最 少 
使 用 替换 )，296 


M 


Machine instruction ( 机 器 指令 )，4 
Machine language ( 机 器 语言 )，130 
Magnetic disk ( 磁盘 )，5，311 
access time ( 访问 时 间 ， 存 取 时 间 )，315 
communication with ( 与 ……: 通信 )，257 
controller ( 控制 器 )，313，315 


cylinder ( 柱 面 )，314 

data buffercache ( 数据 缓冲 区 / 高 速 缓存 )，315 

data encoding ( 数据 编码 )，313 

drive ( 驱动 器 )，313 

floppy disk ( 软盘 )，316 

logical partition ( 逻辑 分 区 )，314 

rotational delay (〈 旋转 延迟 )，315 

sector ( 扇 区 )，314 

seek time ( 寻 道 时 间 )，315 

track (磁道 )，314 

Winchester ( 温 切 斯 特 )，313 
Magnetic tape ( 磁带 )，322 

cartridge ( 盒 式 磁带 )，323 
Manchester encoding ( 曼彻斯特 编码 )，313 
Master-ready ( 主 控 就 绪 )，234 
Master-slave ( 主 从 )， 套 见 Flip-flop 
Mechanical computing devices ( 机 械 计算 设备 )，20 
Memory ( 存储 器 )，4 

access time (〈 访问 时 间 )，5，269 

address ( 地 址 )，5 

address space ( 地 址 空间 )，29 

asynchronous DRAM ( 异步 DRAM )，276 

bandwidth ( 带宽 )，279 

bit line ( 位 线 )，270 

byte-addressable ( 按 字 节 寻 址 )，30 

cache ( 高 速 缓存 )， 参 见 Cache memory 

cell (单元 ) 271，273，274，283 

controller ( 控制 器 )，281 

cycle time ( 周期 时 间 )，269 

DDR SDRAM, 279 

delay (延迟 )，171 

DIMM， 参 见 Memory module 

dual-ported ( 双 端 口 )，158 

dynamic ( DRAM， 动态 RAM )，274 

fast page mode ( 快速 页 模式 )，276 

flash ( 闪存), 5 

hierarchy ( 层次 结构 )，288 

latency ( 延迟 )，278 

main ( 主要 的 )，4 

module ( 模块 )，281 

multiple module ( 多 模块 )，449 

primary ( 主要 的 )，4 

Rambus，279 
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random-access memory (RAM， 随 机 访问 存储 
器 )，5，269，270 
read cycle ( 读 周 期 )，273，274 
read-only memory (ROM， 只 读 存 储 器 )，282 
refreshing ( 刷新 )，274，282 
secondary ( 辅助 的 )，5 
SIMM， 和 参见 Memory module 
static ( SRAM ， 静 态 存 储 器 )，271 
synchronous DRAM ( SDRAM， 同 步 动 态 随 机 
存储 器 )，276 
unit ( 部 件 )，4 
virtual ( 虚拟 )， 套 见 Virtual memory 
word ( 字 ), 5 
word length ( 字 长 ),，5 
word line ( 字 线 )，270 
write cycle( 写 周 期 )，273 ，274 
Memory Function Completed signal ( 存储 器 功能 完 
成 信号 )，171 
Memory management unit ( MMU， 存 储 器 管理 部 
件 )，306 
Memory pages ( 存储 器 页 )，306 
Memory-mapped IO ( 存储 器 映射 UO )，97，229 
Memory segmentation ( 存储 器 分 段 )，662 
Mesh network ( 网 状 网 络 )，452 
Message passing ( 消息 传递 )，19，456 
Microcontroller ( 微 控制 器 )，386，390 
ARM，391，414 
Freescale，391，413 
Intel，391，413 
Microinstruction ( 微 指令 )，183 
Microprocessor ( 微 处 理 器 )，21 
Microprogram ( 微 程序 )，183 
Microprogram counter ( 微 程 序 计 数 器 )，184 
Microprogram memory ( 微 程序 存储 器 )，183 
Microprogrammed control ( 微 程 序 控制 )，183 
Microroutine ( 微 例 程 )，183 
Microwave oven ( 微波 炉 )，386 
Miss ( 失效 )， 参 见 Cache memory 
MMU ， 参 见 Memory management unit 
Mnemonic ( 助 记 符 )，34，49 
Mouse ( 鼠标 ),，4 
Multicomputer ( 多 计算 机 )，19，456 
Multicore processor ( 多 核 处 理 器 )，19，457 


Multiple issue ( 多 发 操作 )，212 
Multiple-precision arithmetic ( 多 精度 运算 )，77， 
336，5$5$2，572，623，081 
Multiplexer ( 多 路 复 用 岩 )，507 
Multiplication ( 乘法 )，344 
array implementation ( 阵列 实现 )，344 
Booth algorithm ( Booth 算法 )，348 
carry-save addition ( 进位 保留 加 法 )，353 
CSA tree (CSA 树 )，355 
3-2 reducer ( 3-2 简化 器 )，355 
4-2 reducer ( 4-2 简化 器 )，357 
7-3 reducer ( 7-3 简化 器 )，380 
foating-point ( 浮 点 )，367 
sequential implementation ( 顺序 实现 )，346 
signed-operand ( 有 符号 操作 数 )，346 
Mnultiprocessor ( 多 处 理 器 )，19，448 
cache coherence ( 高 速 缓存 一 致 性 )，453 
interconnection network ( 互连网 络 )，449 
local memory ( 局 部 存储 器 )，449 
non-uniform memory access (NUMA ， 非 统一 存 
储 器 访问 )，449 
program parallelism ( 程序 并 行 性 )，456 
shared memory ( 共享 存储 器 )，19，448 
shared variables ( 共享 变量 )，448，457 
speedup ( 加 速 )，461 
uniform memory access ( UMA， 统 一 存储 器 访 
问 )，449 
Multiprogramming ( 多 道 程序 )，145 
Multistage hardware ( 多 段 硬 件 )，155，162 
Multitasking ( 多 任务 )，145 
Mnultithreading ( 多 线程 )，444 


N 


Nios II processor ( Nios I 处 理 器 )，529 
Noise ( 噪声 )，251，482，489 
Noise margin ( 噪声 容 限 )，489 
Notebook compnuter ( 笔记 本 电脑 )，2 
Number conversion ( 数字 转换 )，23 ，372 
Number representation ( 数 的 表示 )，9 
binary positional notation ( 二 进 制 按 位 计数 法 )，9 
fxed-point ( 定点 )，16 
floating-point ( 浮 点 )，364 
hexadecimal ( 十 六 进 制 )，54 


1's-complement ( 反 码 )，10 PCI， 参 见 Bus standards 

sign-and-magnitude ( 原 码 )，10 PCI Express， 参 见 Bus standards 

signed integer ( 有 符号 整数 )，10 Peer-to peer ( 点 对 点 )，251 

ternary ( 三 进 制 )，378 Performance (性 能 )，17 

2’s-complement ( 补 码 )，10 basic equation ( 基本 公式 )，209 

unsigned integer ( 无 符号 整数 )，10 memory ( 存储 器 )，300 

modeling ( 建 模 )，460 
O pipeline ( 流水 线 )，209 
Personal computer ( 个 人 计算 机 )，2 

Object program ( 目标 程序 ) 49，130 Phase encoding ( 相位 编码 )，313 


On-chip memory ( 片上 存储 器 )，425 
1’s-complement representation ( 反 码 表示 )，10 
OP code (操作 码 )，49 
Operands( 操作 数 )，4 
Operand forwarding( 操作 数 转 发 )，198 
Operating system ( 操作 系统 )，143 
interrupts (中断 )，146 
multitasking ( 多 任务 )，146 
process ( 进程 )，148，444 
scheduling ( 调度 )，148 
Optical disk ( 光盘 )，5，317 
CD-Recordable ( CD-R ) ( 可 刻录 CD )，320 
CD-Rewritable ( CD-RW ) ( 可 擦 写 CD )，321 
CD-ROM ( 只 读 光盘 )，318 
DVD (数字 多 功能 光盘 )，5，321 
Out-of-order execution ( 无 序 执行 )，215 
Output unit ( 输出 设备 )，6 
Overflow〔( 洲 出 )，14，15 
detection ( 检测 )，551 


Physical memory address ( 物理 存储 器 地 址 )，305 
Pin assignment ( 引 脚 分 配 )，431 
Pipelining ( 流水 线 )，19，194 
bubbles (气泡 )，198 
hazards( 冲突 )，197 
performance ( 性 能 )，209 
stalling( 暂停 )，197 
ColdFire，219 
IA-32, 219 
Pixel ( 像素 )，388 
Plug-and-play( 即 揪 即 用 )，249，253 
Pointer register ( 指针 寄存 器 )，42 
Polling ( 轮 询 )，98 
Pop operation ( 出 栈 操 作 )， 参 见 Stack 
Portable computer ( 便携 式 计 算 机 )，2 
POSIX threads ( Pthreads ) library ( POSIX 线程 
库 )，460 
Prefetching ( 预 取 )，304 
Primary storage ( 主 存储 器 )，4 
Printer ( 打印 机 )，6 


可 Priority ( 优先 级 )，237， 参 见 Arbitration 
Page ( 页 )， 参 见 Virtual memory Privileged instruction ( 特权 指令 )，311 
Page fault ( 页 故障 )，309 Process ( 进程 )， 参 见 Operation system 
Parallel IO interface ( 并 行 VO 接口 )，425 Processor ( 处 理 器 )，4，152 
Parallel processing( 并行 处 理 )，444 core〈 核 ， 核心 ) 422 
Parallel programming ( 并 行 编程 )，456 multicore( 多核 )，19 
Parallelism ( 并 行 化 )，17 Processor stack〈 处 理 器 堆栈 )，55 
instruction-level ( 指令 级 )，17 Processor status register ( 处 理 器 状态 寄存 器 )，106 
Processor-level ( 处 理 器 级 )，17 Nios I，554 
Parameter passing ( 参数 传递 )，59 ColdFire, 572 
by value ( 按 值 )，62 ARM, 613 
by reference( 按 地 址 )，62 IA-32，663 


PC ， 参见 Program Counter Processor register ( 处 理 器 寄存 器 )，8 
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Program ( 程序 )，4 
Program-controlled IO ( 程序 控制 /O )， 参 见 
Input/Output 
Program counter ( PC， 程 序 计数 器 )，7，37，152， 
178 
Program state ( 程序 状态 )，148 
Programmable array logic ( PAL， 可 编程 阵列 逻辑 )，511 
Programmable logic aray ( PLA， 可 编程 逻辑 阵列 )，509 
Propagation delay ( 传播 延迟 ): 
logic circuit ( 逻辑 电路 )，489 
bus ( 总 线 )，231 
Protection ( 保护 )，311 
Pseudoinstruction ( 伪 指 令 )，44，537，548，637 
Push operation ， 进 栈 操作 ， 参 见 Stack 


Q 


Quartus II software ( Quartus II 软件 )，425 
Queue ( 队列 )，55，92， 参 见 Instruction 


R 


RAID disk systems ( RAID 磁盘 系统 )，317 
Rambus memory ( Rambus 存储 器 )，279 
Random-access memory(RAM， 随 机 访问 存储 器 )， 
5, 269 
Reaction timer( 反应 定时 器 )，401 
Reactive system ( 反应 系统 )，386，401 
Read operation 〈 读 操作 )，8 
Read-only mem?ry (ROM， 只 读 存 储 器 )，282 
electrically erasable ( EEPROM， 电 可 撤除 可 编 
程 只 读 存 储 器 )，284 
erasable ( EPROM， 可 擦 除 可 编程 只 读 存储 
器 ), 4 
fash ( 内 和 )，284 
programmable ( PROM， 可 编程 只 读 存 储 器 )， 
283 
Real-time processing ( 实时 处 理 )，106 
Reduced Instruction Set Computer ( 精简 指令 集 计 算 
机 )， 参 见 RISC 
Refreshing memories ( 刷新 存储 器 )，274，282 
Register ( 寄存 器 )，6，502 
access time ( 访问 时 间 ). 6 
base ( 基 址 )，48 


control ( 控制 )，110，553 
general-purpose ( 通用 )，8 
index ( 变 址 )，45 
por ( 端口 )，158 
renaming ( 重 命名 )，216 
Register file ( 寄存 器 文件 )，158 
Register transfer notation ( RTN， 寄 存 器 传送 标 
记 记 3 
Reorder buffer ( 重 排序 缓冲 器 )，216 
Replacement algorithm ( 置换 算法 )，296 
Reservation station ( 保留 站 )，215 
Ring network ( 环 状 网 络 )，451 
RISC ( Reduced Instruction Set Computer， 精 简 指 
令 集 计 算 机 )，34，154，530，612 
ROM， 参 见 Read-Only Memory 
Rounding (伟人 )， 参 见 Floating point 


S 


SAS， 参 见 Bus standards 
SATA， 参 见 Bus standards 
Scaler ( 定 标 器 )，503 
Scheduling ( 调度 )， 参 见 Arbitrauon Operating 
system 
SCSIbus (SCSI 总 线 )， 参 见 Bus standards 
Secondary storage ( 辅助 存储 器 )，5 
Sensors ( 传感器 )，407 
Sequential circuits ( 时 序 电 路 )，494，516 
finite state machine ( 有 限 状 态 机 ;，520 
state assignment ( 状态 分 配 )，518 
state diagram ( 状态 图 )，516 
state table( 状态 表 )，517 
synchronous ( 同步 )，520 
Serial transmission〔 串 行 传输 )，243 
Server ( 服务 器 )，2 
Setup time ( 建立 时 间 )，231，498 
Seven-segmeut display ( 七 段 显 示 器 )，124，507 
Shadow registers ( 影子 寄存 器 )，105 
Shared memcry ( 共享 存储 器 )，448 
Shift register ( 移 位 寄存 器 )，503 
Side effccts ( 副作用 )， 参 见 Instruction 
Sign bit ( 符号 位 )，10 
Sign extension ( 符号 扩展 )，15 
Single-instruction multiple-data ( SIMD ) processing 


( 单 指令 流 多 数据 流 处 理 )，445 
Skew ( 相位 偏 移 )， 参 见 Bus 
Slave-ready ( 从 动 就 绪 )，233 
Snoopy cache ( 监听 高 速 缓存 )，455 
Soft processor core ( 软 处 理 器 核 )，530 
Software interrupts ( 软件 中 断 )，146 
SOPC Builder, 425 
Source program ( 源 程 序 )，49 
Speculative execution ( 推测 执行 )，214 
Speedup ( 加 速 )，22，461 
Split-transaction protocol ( 分 割 事 务 协议 )，450 
SR latch ( SR 锁 存 器 )，494 
Stack ( 栈 , 堆栈 )，55 
frame ( 结构 )，63 
frame pointer ( FP ) ( 结构 指针 FP )，63 
in subroutines( 在 子 程序 中 )，60 
pointer (SP ) (指针 SP )，55 
pushdown (下 推 )，55 
push and pop operations ( 进 栈 和 出 栈 操作 )，55 
Standards( 标准 )， 参 见 Bus standards 
IEEE floating-point ( IEEE 浮 点 )，16，364 
IEEE-1149.1, 416 
Start-stop format ( 起 止 方式 )，245 
State diagram ( 状态 图 )，516 
State table( 状态 表 )，517 
Static memory ( SRAM ) ( 静态 存储 器 )，271 
Status fag ( 状态 标志 )， 参 见 Input/Output 
Status register ( 状态 寄存 器 )，106 
Stored program ( 存储 程序 )，4 
Subroutine ( 子 程序 )，$6，170，186 
linkage ( 链接 )，57 
nesting ( 攀 套 )，58，64 
parameter passing ( 参数 传递 )，59 
Nios II, 541 
ColdFire, 587 
ARM, 631 
IA-32，679 
Subtraction ( 减法 )，13 
floating-point ( 浮 点 )，367 
Sum-of-products form ( 积 之 和 形式 )，470 
Supercompnuter ( 超级 计算 机 )，2 
Superscalar processor ( 超标 量 处 理 器 )，212 
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Supervisor mode ( 管 态 模式 )，311，555，596，640 
Symbol table ( 符号 表 )，131 

Synchronization ( 同步 )，458 

Synchronous DRAM ( SDRAM， 同 步 DRAM )，276 
Synchronous sequential circuit ( 同步 时 序 电路 )，520 
Synchronous transmission ( 同步 传输 )，246 
Syntax ( 语法 )，49 

System-on-a-chip ( 片上 系统 )，421 

System space ( 系统 空间 )，310 


T 


Technology ( 技术 )，17 
Telemetry ( 遥测 技术 )，390 
Testability ( 可 测试 性 )，416 
Text editor ( 文本 编辑 器 )，130 
Thread (线程 )，444 
creation( 创建 )，458 
synchronization ( 同步 )，458 
Three-state ( 三 态 )， 参 见 Tri-state 
Thrashing ( 颠 敏 )，327 
Threshold ( 阔 值 )，482 
Time slicing ( 时 间 片 )，146 
Timers ( 定时 器 )，120，397，427 
Timing signals ( 时 序 信号 )，6，171 
Torus network ( 圆 环 形 网 络 )，453 
Touchpad ( 触摸 板 )，4 
Trace mode ( 跟踪 模式 )，136 
Trackball ( 跟踪 球 )，4 
Transducers ( 传感器 )，407 
Transistor ( 晶体 管 )，17，20 
Transition time ( 转换 时 间 )，490 
Translation lookaside buffer (TLB， 转 换 监 视 缓冲 
区 )，308 
Transmission ( 传输 ) 
asynchronous ( 异步 )，245 
differential ( 差分 )，251，256，258，279 
single-ended ( 单 端 )，250，256 
start-stop ( 起 止 )，245 
synchronous ( 同步 )，246 
Tri-state gate ( 三 态 门 )，179，236，240，281， 
491 
Truth table ( 真 值 表 )，466 
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2’s-complement representation ( 补 码 表示 )，10 
U 


UART (Universal Asynchronous Receiver Transmitter， 
通用 异步 收发 器 )，395 

Universal Serial Bus ( USB ， 通 用 串 行 总 线 )，247 

Update protocol ( 更 新 协议 )，453 

User mode ( 用 户 模式 )，311，555，5396，639 

User space ( 用 户 空间 )，310 


V 


Vector processing ( 疝 量 处 理 )，445，695，696 
Vectorization ( 向量 化 )，446 
Very large-scale integration ( VLSI， 超大 规模 集 
成 )，17 
Virtual address ( 虚拟 地 址 )，305 
Virtual memory ( 虚拟 存储 器 )，269，305 
address translation ( 地 址 转换 )，306 
page (页 )，306 
page fault ( 页 故障 )，309 
page frame ( 页 帧 )，308 


page table ( 页 表 )，308 
translation lookaside buffer (TLB ， 转 换 监 视 组 
冲 区 )，308 
virtual address (〈 虚拟 地 址 )，305 
Volatile ( 易 失 性 ) 
variable ( 变量 )，138 
memory ( 存储 器 )，274 


W 


Wait loop 〈 等 待 循环 )，100 

Waiting for memory ( 等 竺 存储 器 )，171 

Winchester disks ( 温 切 斯 特 磁 盘 )，313 

Word ( 字 ), 5,，29 

Word alignment ( 字 对 齐 )，31 

Word length( 字 长 )，5，29 

Workstation ( 工作 站 )，2 

Write-back protocol ( 写 回 协议 )， 参 见 Cache 
memory 

Write buffer ( 写 缓 冲 区 )，303 

Write operation ( 写 操 作 )，8，32 

Write-through protocol ( 直接 写 协议 )， 参 见 Cache 


memory 


